Главная arrow книги arrow Копия Глава 15. Вероятностные рассуждения во време arrow Распознавание речи
Распознавание речи

В данном разделе рассматривается одно из наиболее важных приложений вре-меннь/х вероятностных моделей — распознавание речи. Задача состоит в том, чтобы выявить последовательность слов, произнесенных говорящим, используя акустический сигнал. Речь — это доминирующая форма общения людей, и поэтому надежное распознавание речи с помощью машин было бы чрезвычайно полезным. Еще более важной задачей является понимание речи — идентификация смысла фрагментов речи. Но изучение этой темы мы отложим до главы 22.

Речь — это одно из первых проявлений грубого неоткристализовавшегося мира реальных сенсорных данных, с которыми сталкивается человек после своего рождения. Эти данные являются зашумленными, в буквальном смысле слова: в них может присутствовать не только фоновый шум, но и помехи, возникающие в процессе самого преобразования в осознаваемую человеком форму; слова иногда произносятся по-разному, даже одним и тем же говорящим; различные слова могут звучать одинаково и т.д. По этим причинам со временем возникло понимание того, что распознавание речи должно рассматриваться как одна из задач вероятностного вывода.

На наиболее общем уровне эту задачу вероятностного вывода можно определить следующим образом. Предположим, что Words— случайная переменная, пробегающая по всем возможным последовательностям слов, которые могут быть произнесены, а также допустим, что signal — наблюдаемая последовательность акустических сигналов. В таком случае наиболее вероятной интерпретацией фрагмента речи является то значение переменной Words, которое максимизирует вероятность Ρ (words | signal). Как и во многих других случаях, нам может помочь применение правила Байеса: