Рефераты. Распознавание речи в Office XP

Распознавание речи в Office XP

Распознавание речи в Office XP

Андрей Колесов

В версию Microsoft Office XP корпорация впервые включила модуль под названием “Альтернативный ввод”, предусматривающий ввод речевой информации и рукописных текстов. Все это пока работает для английского, японского и китайского языков в соответствующих версиях пакета. Тем не менее познакомиться с возможностями модуля на примере международной английской версии полезно, так как, вполне вероятно, нечто подобное будет доступно для русского языка.

 Распознавание речи в Office XP

Рис. 4. Окно Мастера настройки речи

Как это все работает

Программные модули альтернативного ввода представляют собой автономные компоненты, непосредственно связанные с языковой панелью инструментов Language Bar, которая после установки Office XP прописывается в Windows и автоматически меняет ранее существовавший блок переключения клавиатуры. Так что теперь, щелкнув по значку языка на панели задач, вы можете выбрать команду “Показать панель языка” и увидеть кнопки данной панели (рис. 1). Соответственно средства “Альтернативного ввода” становятся доступны не только офисным приложениям, но и другим программам, поддерживающим данную технологию (например, Internet Explorer 5.0 и Outlook Express 5.0).

Для использования функций альтернативного ввода нужно указать подключение соответствующего компонента в программе установки Office XP (Alternative User Input). В русской версии он отсутствует, но вся справочная информация имеется в локализованном виде, поэтому, обратившись к ней через кнопку Help на языковой панели, можно прочитать описание технологии (рис. 2).

Теперь посмотрим, как работают функции распознавания рукописного текста. Для ввода служат планшеты с перьевым вводом и обычная мышь. Воспользуемся вторым вариантом. Через меню Handwriting на языковой панели вызовем окно Writing Pad, напоминающее Блокнот, введем в нем с помощью мыши — это очень нелегко с непривычки — текст (рис. 3). Не знаю, как вы, а Office XP смог понять в этих каракулях фразу “Hello frоm Andy!” и вставил ее в текущее место документа. Имеется также режим ввода Write Anywhere, при котором писать мышью можно в любой области экрана.

Для распознавания есть два режима выполнения действий: автоматически после отрыва пера от бумаги или по команде после ввода всего текста. Представители Microsoft отмечают, что их механизм позволяет работать со слитным текстом, а не с отдельно написанными буквами, однако на самом деле скорее речь идет о реализации одного из вариантов распознавания. Как известно, существует два способа распознавания, основанные на представлении образа рукописи в виде векторной и растровой модели. Для первого нужно знать, как писался текст, т. е. схему движения пера, для второго — лишь результат в виде графического образа. Второй является более сложным (хотя бы потому, что из векторной модели получить растровый образ очень легко, а наоборот — сложно).

Так вот в Microsoft Office реализован первый вариант, поэтому ввод может выполняться только пером. А распознать текст, написанный на бумаге (после сканирования образа и копирования через буфер обмена в Writing Pad), пока в принципе нельзя.

Для распознавания речи конечно же требуется подключить к компьютеру микрофон. Данный механизм подразумевает необходимость настройки на конкретного пользователя. Поэтому при первом же обращении к средствам распознавания речи вам понадобится обучить компьютер понимать ваше произношение. Для этого нужно сначала ввести некоторые сведения о себе — возраст (до 12 лет или старше) и пол (рис. 4), а потом читать в течение 10 минут предлагаемый текст. С помощью выделения автоматически показываются распознанные слова, т. е. фактически выполняется проверка вашего произношения (движок настроен на североамериканское произношение). В будущем можно пройти дополнительные уровни обучения, а также сделать несколько профайлов для разных пользователей. Процесс обучения включает возможность расширения речевой базы путем ввода слова и записи его произношения.

 Распознавание речи в Office XP

Рис. 1. Языковая панель




2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.