Рефераты. Машины, которые говорят и слушают

У5


Сшибки классификации дают появление "путающихся" поверхност­ных форм (представленных последовательностью квазифонеы) дяя раз­личных слов словаря. Будем считать,  что  матрица ошибок при рас­познавании слов  априори формируется таким образом, что (при сход­стве поверхностных форм различных слов словаря) более часто встре­чающиеся поверхностные формы слов одного класса (при заданном ал­фавите квазифонем) считаются относящимися  к  словам только этого класса,  а  редко встречающиеся сходные поверхностные формы для других слов словаря дают ошибки распознавания. Впрочем, используя синонимию  или  семантико-синтаксические ограничения при  распоз­навании пословно произносимых фраз. Всегда следует добиваться то­го, чтобы подобные случаи  не  происходили (трудности   представ­ляют слова, входящие  в  одну семантико-сиитаксическую группу,ко­торые  нельзя заменить синонимами, например, названия цифр).

Следует отметить,  что  принятые решения о    принадлежности поступившей  на  вход реализации к тому или иному классу  следует делать  но  эталонам с одинаковым числом опорных сегментов   и  с учетом верификации сяова, всякий раз используя эвристически  выб­ранные пороги достоверности,  в  общем случае разные для  различ­ных слов. Так, для  принятия окончательного решения  о принадлеж­ности входной реализации   Уд.   к классу Wy  необходимо  выбрать

и w, , который ооответ-

два  наиболее вероятных кандидата

—   —— -    .                          ^ ствуют вероятности p(v,/u7y] и ^(i^/г^ ), и проверить,удовлет­воряются ли условия:

WM,)>^,;

Р^/^-Р^/^,)^^

где А^   - пороговое значение вероятности того, что входная реа­лизация соответствует олову у/,   ; Ay,    - пороговые значения разности условных вероятностей принадлежности входной реализации

г1д. классам                     и vf. , при которых принимается решение о клас-

сификации  у^ .

Пороговые значения /Зд,/!,,    выбираются   экспериментально по  заданной системе используемых фонетических признаков,а также требуемых точности распознавания и вероятности отказов от    рас­познавания.  В  случае, если подбором порогов заданные требования к  системе распознавания не удается выполнить, следует   провести более детальный анализ неопорных сегментов, иди  попытаться улуч­шить систему признаков.  В ряде случаев дяя удовлетворения задан­ных  в  системе требований следует использовать синонимию.

66


Рассмотрим далее более конкретно, как оценить    лексическую неопределенность словаря V  языка речевого общения неадаптивной системы автоматического распознавания. Аналогично тому, как оце­нивалась неопределенность алфавита фонем, можно определить слож­ность распознавания входного словаря V , состоящего из R слов, и вычислить эквивалентный размер входного словаря. При этом необ­ходимо получить вероятности p(v^/w,) одиэости областей призна-хового описания слов i^, « V, ur, б W, г= /7Д. 3s /75. которые пред­ставляются в виде последовательности фонетических единиц (фоне­тической транскрипции слов). Далее оценим вероятности p(ff^/v7y).

Как уже отмечалось, на основе лингвистических знаний, эта-жоны слов Wy (. W    представляются в вида фонетических ( вер­нее, квазифонетических) цепочек,совокупность которых описывается графом с конечным числом состояния, а каждая фонема - признака­ми способа и места образования. Слову VT,   соответствует одна или несколько траекторий (цепочек поверхностных форм) на графе (количество траекторий зависит от метода произношения и харак­теристики диктора). Направленный граф f (W,)   представляет все фонемы этахона сяова иг, б W , который имеет uf,   поверхностных форм, k= !, 2, . . ., А-з ; uly = U'1Л ; каждая поверхностная форма


^ e w,   содержит

,.^,-...^ Пусть р ( иГу)

ur, e                                     1= l(3.k) опорных квааифонем, т.е. иг,

), } I-- /,2,..., 1(з, k).

априорная вероятность появления слова u^eW на выходе блока лексического распознавания, а априорная вероят-


р (vfs„ ) •       При


ность иГу   поверхностной формы этого же оаова этом выполняются условия

л,          « Р(Щ,)= Z: Р(^) ; £/?(ur,)=/.

Необходимо отметить, что количество опорных сегментов    в поверхностных формах слов выходного словаря различно, т.е. предел изменения индекса  I   зависит как от номера слова, так и    от его поверхностной формы I = I (.з, k}.

Для того,чтобы осуществить оценку неверной классификации слов словаря на стадии лексического распознавания по фонетичес­кой структуре этих слов, выполним операцию разбиения всех   по­верхностных форм эталонов слов на М  фонетических групп с одина­ковым количеством опорных сегментов 1= I (з) . При этом    слова, поверхностные формы которых принадлежат разным группам, не будут Путаться между собой, поскольку их легко классифицировать по числу "опорных" фонем, составляющих слова.

8?

Вообще говоря, можно представить себе фонетические    группы эталонных поверхностных форм, отличающиеся не только числом опор­ных фонем, но и их характером, а также порядком следования.Если учесть все три фактора, позволяющие разбить эталоны на существен­но большее число фонетических групп, то дальнейшие    рассуждения можно отнести   к каждой из этих групп. Для простоты,однако, бу­дем считать, что мы имеем   М    фонетических групп, в каждой из которых одинаковое число опорных сегментов. В практических за­дачах при разбиении на группы следует учитывать все эти факторы, однако необходимо строго ограничивать число различных     опорных сегментов, выбирая лишь те, которые не путаются между собой и ха­рактеризуются групповыми признаками места образования -  ударные гласные, смычные, фрикативные   [81,60] .

Итак, допустим, что существует М   фонетических  групп слов W, , W^, . . . , W^ , . .., W^ , в каждой из которых^ одинаковое число опорных квазифонем. Общее число эталонов И/= U W^ , а ко­личество фонем, составляющих: слова (длина фонетической   цепочки) каждой группы, об означим через I ; т= /,/И.

Представляя таким образом слова словаря на входе СРР и   ис­пользуя матрицы ошибочной классификации фонем, составляющих слова

/Кй/&)-[Ру],                   (2.5) можно оценить вероятности p^(v /Wy) спутывания  поверхностных

форм слов внутри каждой группы слов                                    следующим образом:


где

t = t, 2, . . . , t^   - длина фонетической цепочки     группы слов ^ , а^ е ^ , Ь„ е иг,.

В общем случае одно и ъо же слово Wy   может иметь К, поверхностных форм, имеющих разное число фонетических   элементов и попадающих в разные группы слов W^, .  Поэтому общую   услов­ную вероятность "спутывания" слов словаря определим


(2.8)


P(v^/w,l= Г P(w^) р^ ( ^ /г^-) .

Для определения потери информации в СРР, которая рассматрива­ется как канал перэдачи информации, в случае распознавания слов используем выражение

86

(2.9)


KV/W)-- -Z p(w,)i p(v^/ w^ locj^ p( v^ /v/,).

/ (V/W)


Тогда  2       определяет  эквивалентный   размер словаря —


число альтернативных слов  на  входе системы распознавания, а

v)  - фактический  объем  входного словаря, где


R

Х

г'1


(2.10)


 


Эти выражения, аналогичные формулам (2.4), (2.5), оцениваю­щим фонетическую неопределенность, являются критерием      оценки лексической неопределенности. Они определяют сложность распознава­ния словаря и позволяют судить о качестве СРР. При автоматичес­кой маркировке, наряду с ошибками неверной кдассификации фонем, существуют, как уже отмечалось, ошибки неверной сегментации, при­водящие к слиянию отрезков, соответствующих смежным фонемам,    в один сегмент или расчленению отрезка, соответсвувщего одной фонеме, на несколько смежных фонем разных классов. При   выборе альтернативных слов словаря надо следить за тем, чтобы   неприят­ности такого рода не вызывали подобия последовательностей фоне­тических единиц, соответствующих разным словам. Для этого   необ­ходимо использовать матрицы, отражающие возможные варианты   сег­ментации слов словаря и частоты встречаемости тех или иных вари­антов сегментации, соответствующих различит поверхностным фориам слов. Так как информация о словах, содержащихся в фонемах,избы­точна, то часто при оценке различимости слов словаря     вполне достаточно использовать опорные фонемы, допускающие минимум оши­бок расчленения и слияния. Поэтому в формуле (<i.7) дяя прибли­женной оценки спутывания слов необходимо в первуи очередь   ис­пользовать вероятности ошибочного распознавания таких    опорных фонем, которые в данном слове не дают ошибок слияния и расчлене­ния.

§ 2.3. О языке описания данных в системе автоматического речевого запроса информации

2.3.1. Понятийный язык  и  двухступенчатое иерархическое пос­троение  его  грамматического представления. Информационные  сис­темы, стояь распространившиеся  в настоящее время, требувФ обще­ния  с  ними с помощью устной речи на языяв, близком к естествен­ному. Необходимая  нам  информация должна быть выдана по  запросу

Страницы: 1, 2, 3, 4, 5



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.