После того как система примерно определила слова, входящие в запрос, она анализирует их с помощью языковой модели. Это тоже очень сложная задача, которая требует своего словаря. В данном случае языковая модель базируется на статистике запросов поисковой системы Google и содержании страниц интернета, а это даже не миллионы, а миллиарды слов и их сочетаний. Правда, с точки зрения компьютерного анализа эта задача более простая, поскольку данные текстовые.
Далее везде
Однако круг задач, для которых необходимо распознавание голоса, не ограничивается только голосовым поиском. А как насчет других применений? «Технически это вполне реализуемо, во всяком случае в некоторых областях, — говорит Евгений. — Скажем, сервис Google Voice (доступный пока только в США) — это голосовая почта, сообщения которой транскрибируются и отправляются владельцу на e-mail. Или Google Voice Actions, позволяющий управлять телефоном на базе операционной системы Android — звонить, набирать сообщения, делать записи, прокладывать маршрут — и все с помощью одного только голоса, правда, пока только на английском языке. Можно даже диктовать документы, но точность распознавания при этом ниже, поскольку языковая модель Google базируется на статистике именно поисковых запросов. Сейчас мы также тестируем систему транскрибирования речи в виде субтитров в видеоклипах, размещенных на портале Youtube. Ну а совместно с технологией синтеза речи распознавание голоса уже можно использовать как систему перевода с одного языка на другой».