Рефераты. Машины, которые говорят и слушают

Зак.480


89


 


последовательности понятийных дескрипторов, которую человек может произнести, не используя жесткого порядка следования этих дес­крипторов. Такое представление совокупности дескрипторов - поня­тийного поля не только обеспечивает естественность запроса ин­формации из базы данных, но и фактически не увеличивает времени поиска релевантной информации, так как при этом учитываются  от­ношения между понятиями и используется иерархический принцип с ыниыой иерархией, обеспечиваемой перестраиваемой структурой дори­ческого дерева. В связи с этим можно представить общую   грам­матику 6   формирования понятийного поля, включающего посведо-вательность предложений, которые дают информацию о     структуре дег.криптов, в виде иерархически связанных граыиатик    верхнего и нижнего уровней. (Процесс формирования свободных от    ошибок словесных цепочек, полученных в результате автоматического рас­познавания слов и устного редактирования, рассматривать  здесь не будем .) Грамматика верхнего уровня G" определяет общую струк­туру понятийного поля, а языки, обусловленные грамматиками  ниж­них уровней  б[ ,  конкретизируют порождение предложений на уров­не формирования понятийных фраз. Грамматика G"   допускает по­явление понятий (они выражены запросными фразами S^ ),   форми­рующих смысл запроса, в произвольном чередовании. Иными словами, порождающая грамматика последовательности понятий - есть простей-вая грамматика типа 0 (по Хомскому), в которой нетерминальными символами vh   являются обобщенный дескриптор понятийного поля (поисковый образ запроса) и понятийный уровень, а терминальными V - конкретное наименование понятий (названия уровней) ^ .   Не­терминальный символ   { обобщенный дескриптор понятийного поля j является начальным символом  S   в грамматике в", а правила вы­вода р   сводятся к допустимости перестановок терминальных сим­волов s.—^s-.такчто для понятий s,,Sg,...,5^ язык, обус­ловленный этой грамматикой, допускает К ' предложений длины К , в каждом из которых все понятия различны:

S, , S, , . . . , S„ ; ^ , s, , • • • , ^ ; 5,. S,, S, ,. .., 5^ .

Вообще говоря, грамматики типа   0 допускают    бесконечное количество словесных цепочек (предложений) различной длины, состав­ленных из терминальных символов. Если считать, что нас интере­суют словесные цепочки с неповторяющимися терминальными симво­лами, и представлять обобщенный дескриптор понятийного    поля цепочками переменной длины J = f -L К , то число N возможных пред­ложений, используемых для работы и допускаемых языком     этой гр^матикм,                ^^.,                       ^^

90

Каждый из терминальных символов грамматики в°  в   свою очередь является начальным (и нетерминальным) символом порож­дающей грамматики второго уровня  (7,   , накладывающей или не нак-


ограничения на формирование предложений в t'-ru понятийного уровня (рис.2.3).

ладывающей ограничения на формирование предложений в   рамках каждого     t-ru понятийного ур

Рис. 2.3. Порождения тийных полей

Отметим, что в зависимо­сти от особенностей   терми­нального словаря каждого уров­ня и привычки   пользователей к произношению фраз     этого уровня на естественном языке порождающая грамматика с   на­чальным (нетерминальным) сим­волом, полученным на    преды­дущем уровне, может быть нуле­вого, первого, второго     иди третьего типа, определяемого соответствующими правилами вывода.

Далее мы рассмотрим оценку грамматической сложности языка (с точки зрения автоматического распознавания речи) на    уровне

формирования предложений с учетом произношения слов, являющихся

Go терминальными символами грамматики    , и покажем, что означает

"подстройка под словарь и язык" в неадаптивных системах авто­матического распознавания слов. Языки, определяемые грамматиками б", (7/, G',...,(?/,..., G^ (рис. 2.3), будем называть языками системы распознавания речи, подразумевая, что с точки зрения автоматичес­кого распознавания слова, являющиеся терминальньгми символами грам­матики высшего уровня, также конкурируют между собой и определяют начальный символ сети (графа), которой представляется языком СРР.

2.2.2. Оценка сложности языка с точки зрения автоматичес-кого распознавания пословно произносимых предложений.   Синтаксис и семантика языка СРР, определяемых грамматилаки {G^} , наклады­вают ограничения на порядок следования слов в предложении   в характер возможных словосочетаний. Эти ограничения существенно об­легчают задачу распознавания речи вследствие сокращения общего по­искового пространства признаков.

Для приближенной оценки грамматической сложности языка   СРР рассмотрим грамматику автоматического языка как наиболее   прос­того и наиболее поддающегося количественному анализу.Грамматики Нулевого, первого и второго типов, как было указано ранее, также можно использовать для формирования предложений в СРР, однако их количественные характеристики подучить сложнее. и тому же ряд за­кономерностей, характерных дяя языков, оаисываяицихся грамматиками

91


большей сложности, можно выявить и на самом простом языке, отно­сящееся к частным случаям языков нулевого, первого и    второго типов и наиболее используемом при формировании предложений в сов­ременных системах распознавания речи.

Правила подстановки в грамматиках третьего типа (автоматных) имеют вид А = а В или А —- В , где А, В с 1^   и а, Ь (. \'i . Для языка СРР   А и В характеризуют названия смысловых групп, а а , Ь - названия слов в смысловых группах - подсдоварях. Грам­матика автономного языка определяется множеством внутренних со­стояний s„3 ,. . .,s^,..., ss и правилом перехода в следующее сос­тояние .

Следовательно, после слова с номером i(n) из группы слов s с S     может следовать слово из подсловаря s^, с s . Кроме того, заданы   S    и   S     - состояния, которыми соответствен­


KG)


но начинаются и кончаются фразы. Например, предложение имеет структуру

l.(G)=S„v, v. ,.

где veS,, v, e S,, .                                             т = /, 2, . . . , I

Оценим синтаксическую сложность автоматного языка сред­ним коэффициентом ветвления К^р ,   который определяется средним числом возможных слов в каждой точке дерева ветвления:


К,


ср


i м -—Z К,

N l-i


(2.К)


 


количест-

^десь   К^    - коэффициент ветвления в точке i ;   N во точек ветвления.

Средний коэффициент ветвления удовлетворительно    описывает синтаксическую сложность языка тогда, когда появления слов     в предложении равновероятны.

Если средняя длина предложения /^д , то произведениями Z^„ «/<- можно оценивать грамматическую сложность рассматриваемых язы­ков речевого запроса и даже в какой-то мере (очень приближенно) сравнивать точность автоматического распознавания пословно произ­носимых фраз. Но эта оценка не учитывает фонетических   особен­ностей подсловарей. К тому же в реальных условиях различные слов8 словаря речевого общения имеют разные вероятности при формиро­вании фраа. Для учета этих факторов будут использованы квазифоне­тическое представление поверхностных форм слов (см.п.2.2.2) и сто­хастическая порождающая грамматика, у которой задано вероятност­ное распредеаенме правил образований предложений рц   из слов в

i/

92

»аждой точке ветвления 1= 1,п нкя выполняется условие


При этом для всех точек              ветвле-


(2.13)


где К- - количество возможных слов в точке I (коэффициент вет­вления). Тогда вероятность получения фразы l(G)6i(G) в резуль­тате применения t  правил подстановок равно произведению веро­ятностей примененных при этом выводе правил образования. Отметим, «то число слов, составляющих предложения, может быть   различное И зависит от количества правил,примененных при формировании дан­ного предложения.

Определим энтропию Н(/-}   языка /(0) .Для этого обозна­чим через  L^   множество всех фраз длины п слов, допускаемых грамматикой G:

через

ЮЛИЯ

р(^)

/ -и1^

^п-\Ч '•••'

f(n)

Лп) '-г '• • •

- вероятность

•s • • • • ' получения

фразы /(0)

HU

)

языка речевого общения

 

(2.14)

if/))        f(n)     •} ^ • • • • • '-г ' • • •)•

Тогда эн-

г(л)

н^-^, ^ ^О^/^О,           (2.15) где Т - максимальная длина предложения. Естественно, что


(2.16)


г z pa^)=f.

/,., iyki,   г

В случае, когда различные предложения, порождаемые граммати­кой  G ,  имеют разные смысловые интерпретации, тогда   энтропия Языка характеризует  его  возможность передавать информации.    В соответствии  с  теорией кодирования информации число   возможных фраз языка  с  энтропией  H(Z)  будет 2н(t),      и это значение определяет размер входного языка.

Для определения сложности (неопределенности)   распознавания языка речевого обшения рассмотрим процесс распознавания предложе­ния  в  виде последовательности распознавания слов из подсловарей данного уровня, размеры которых определяются коэффициентами  вет­вления  К^ .  Тогда для  оценки сложности распознавания    языка необходимо оценить сложность распознавания всех N  подсловарей

93


этого уровня, где <V - число точек ветвления. Ранее, в п.  2.2.3, рассматривали, как  можно оценить сложность распознавания    сло­варей  по  фонетической структуре слов, поэтому здесь на     этом вопросе подробно останавливаться не  будем, а только отметим, что вероятность появления слова  г^

вероятностью P(Vf, } применения'

в подсловаре i- определяется /с.-го   правила подстановки в

каждом узле   дерева  стохастической   автоматной   грамматики. Имея условные  вероятности р. (v^/Шс)  ошибочного распознава­ния   слов  каждого  из подсловарей  и   рассматривая  CPF как ка­нал передачи информации, определяем потери информации /„ду в слу­чае распознавания предложений, произносимых пословно,   следующим образом:

к   к;

£

с?

Обычно интересуются,  как  распределены потери    информации по  различным понятийным уровням  S^   и различным узлам   графа, представлякщего автоматную грамматику уровня. Важно знать,в каком узле языка общения "тонкое место"  и  как его устранить.

Для общей оценки сложности распознавания предложений,  кото­рые произносятся  пословно  в  соответствии с заданной    грамма­тикой  G ,   можно пользоваться выражением  2 "" ,   которое опре­деляет среднее  число возможных альтернативных фраз на  входе   в СРР.  В  случае, если СРР работает баз ошибок, при пословном произ­ношении фразы на  выходе системы всегда одно предложение.

Формула (2.17) оценивает сложность распознавания фраз  языка речевого общения СРР.  При  этом отметим, что эта мера    зависит как  от фонетической структуры слов словаря, так и от  граммати­ческих правил образования предложений.  В  практических СРР   при

распознавании языка необходимо, чтобы /„   была близка к нулю

^пот < ] порог • (РВД11118 ошибки при распознавании слов можно   устра­нить словами устного автоматического редактирования .) Если    это условие  не  удовлетворяется,  то  возникает проблема   изменения языка, которая сводится   к  изменению словаря системы и/ияи грам-иатики языка  с  целью увеличения точности распознавания.Для это­го можно  либо использовать синонимию  в подсловарях, имеющих наи­большую неопределенность, либо изменить грамматическую  структуру предложения путем изменения грамматики  G ,   которая использует­ся  как  механизм сокращения области поиска, ограничивающей число приемлемых альтернатив.

94

г.3.3. Изменение языка в неадаптивных системах автоматичес­кого речевого запроса.Описанный во. 2.3.1 в общем видепоня-тийный язык речевого общения "человек - информационная систеыа" до­пускает его развитие на основе некоторого ядре или создание -не базе общих представлений о структуре языка. Суть    развития этого языка ("подстройка под язык") сводится: к замене или увели­чению числа терминальных символов грамматики в", определяющей появление, замену или уничтожение целых понятийных уровней, язык которых определяется грамматиками ^ ;   к замене,    уменьшению или увеличении числа терминальных символов грамматик G^ без из­менения числа понятийных уровней.

Понятийный язык речевого запроса информации рассматривается как лингвистический процессор, который представяен     комплексом Программ, обеспечивающим автоматический перевод устного текста в заданный момент для того, чтобы информационная система      могла воспринимать (понимать) фразы, относящиеся к рассматриваемой пред-иетной области. Тогда задача "подстройки под язык" сводится   к модификации (иди вообще построению) этого лингвистического про­цессора, который допускает только правильные, осмысленные   пред-жижения, обусловяенные грамматики 6°, G,', <?,,..., <?/.

В соответствии с п. 2.3.1, задача построения такого    линг­вистического процессора, если заданы множества слов { у, , г^, . . . .... Уд,} словаря   V    описания данных информационной     сис­темы, формально сводится к построению некоторой функции

/ = <f> (v,, ^ , . . .. 1^ ),

где i v, , Vy , . . . , гГд. } б V ,       полностью определяющей работу «Ннгвистичесного процессора (семантико-синтаксического анализато­ра), который допускает только слова, являющиеся грамматически пра­вильными в данном контексте.

Дяя этой цели фразы языка речевого общения представим в виде направленного графа с конечным числом состояний без циклов

(2.18)

Весь словарь (узлы графа) разобьем на I  непересекающихся  поня­тийных уровней, т.е.

V П V^ П . .. П V = О

(2.19)

Для указания связи между словами (узлами) понятийного гра­фа строим матрицу смежности 2)= [и';,], которая распадается    на


D, ,Д,, . . . ,Д„, . . . ,^_,   подматриц, где Д„ =(о^ б {О,/}) указывает смежность      п-го и п+1  уровней графа 6(1/, Г). Тогда задача подстройки "под язык" заключается в     задании

и/или изменении словаря языка речевого общения и матрицы смежно­сти D > указывающей связь между словами понятийного графа.

Иными словами, частичная иди полная замена словари в не­адаптивных системах распознавания фраз, составленных из изолиро­ванных слов и коротких словосочетаний на основе понятийных язы­ков, описываемых грамматиками { 6°, G\, CJ, . . . , G^ } ,  приводит к изменению грамматик, к приспособлению понятийного графа к но­вым требованиям,

Замена терминальных символов {V- ^  грамматик {С/} произво­дится записью в соответствующий массив, где хранятся    эталоны старых слов, новых слов и квазифонетических поверхностных форм, представляющих эталоны нового терминального символа. Если исполь­зуются программы автоматического порождения множества поверхност­ных форм по базовой форме слов (слова), определяющих     новый терминальный символ, то дл.-: замены терминального символа (полу­чения множества эталонов) требуется ввести лишь информацию о пос­ледовательности квазифонетических символов; запись новых   симво­лов можно производить аналогично описанному. Эталоны    названий новых понятийных уровней вводятся так же,потому что они являются терминальными символами грамматики верхнего уровня G"• При вве­дении нового уровня необходимо описать грамматику языка этого уровня и включить эталоны новых терминальных символов. Измене­ние матрицы смежности производится в зависимости от требований измененного языка, от новых понятий и новых      взаимоотношений между словами понятийного графа. Если необходима замена правильных слов словами-синонимами, то никаких изменений матрицы смежности не производится. Оысл введения слов-синонимов сводится лишь   в уменьшению 1^,    (2.17).


Страницы: 1, 2, 3, 4, 5



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.