Моя твоя понимай: Естественный язык компьютеров

Десятки лет, сотни исследований и разработок, тысячи попыток – лишь теперь компьютеры начинают понемногу понимать обычную человеческую речь, фразы, сформулированные на естественном языке.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Некоторое время назад мы рассказывали о Премии Лёбнера, цель которого — создание компьютерной программы, способной общаться с человеком так естественно, что собеседник этого не заметит. Ежегодные соревнования за приз в 100 тыс. долларов начались еще в 1991 г., но до сих пор никому этого не удавалось. В самом деле, просто личное общение с любой из программ-конкурсантов показывает, сколь далеко им до нормального человека — мы даже как-то брали интервью у одной из них, и выглядело это достаточно безнадежно.

Впрочем, надежда есть. Вспомним хотя бы успехи «Яндекса» и Google в понимании запросов, сформулированных на естественном языке. Не говоря уж о Siri, виртуальной ассистентки пользователей iPhone, которая с помощью целого арсенала математических методов может моделировать варианты построения фраз в определенных обстоятельствах общения. Дальнейшее развитие этот подход получил в работе стэнфордских психологов под руководством Майкла Франка (Michael Frank). Ключевым в ней стало использование Байесовской сети, одного из мощных инструментов математической статистики и теории вероятности.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Авторы провели интересный онлайн-эксперимент, в котором приняло участие 745 добровольцев. Им предлагался набор объектов, для одного из которых предлагалось выбрать подходящее слово. К примеру, на экране демонстрируется синий квадрат, желтый круг и желтый квадрат. Вопрос: для обозначения предмета в центре какое слово вы выберете — «круг» или «желтый»? Второй группе предлагалась обратная задача — например, «К какому из этих трех предметов относится слово "желтый"?»

На основе полученного массива данных была создана математическая модель, позволяющая предсказать вероятность использования того или иного слова в зависимости от исходных обстоятельств. Вооруженная этой моделью компьютерная программа может эффективно предсказывать слово, которое скорее будет использовано собеседником-человеком. Возможно, премии Лёбнера осталось залеживаться недолго.