Нейросеть прочла первую книгу о Гарри Поттере и раскрыла секрет Дурслей

Программисты из канадской компании Maluuba разработали алгоритм, позволяющий находить ответы на вопросы в незнакомом тексте. Программу, построенную на нейронной сети, протестировали на книге «Гарри Поттер и Философский камень», доля правильных ответов составила выше 70 процентов. Видео с тестом программы опубликовано на официальном канале компании на Youtube, подробности об алгоритме сообщает MIT Technology Review.
Нейросеть прочла первую книгу о Гарри Поттере и раскрыла секрет Дурслей
Harry Potter and the Philosopher's Stone / Warner Bros. Pictures

Алгоритм представляет собой систему для «осмысления» текстов компьютером, основанную на методике глубокого обучения (Deep learning). Она способна отвечать на вопросы по незнакомому тексту, выбирая правильный вариант из нескольких предложенных. Исследователи тренировали алгоритм на нескольких сотнях рассказов для детей, объединенных с парами вопрос-ответ для каждого текста. После завершения обучения программу проверяли на незнакомом тексте.

Не занимайтесь самолечением! В наших статьях мы собираем последние научные данные и мнения авторитетных экспертов в области здоровья. Но помните: поставить диагноз и назначить лечение может только врач.

Глубокое обучение (англ. Deep learning) — набор алгоритмов машинного обучения, которые пытаются моделировать высокоуровневые абстракции в данных, используя архитектуры, состоящие из множества нелинейных трансформаций. Под термином «глубина» в данном случае понимается глубина графа вычислений модели — максимальная длина между входным и выходным узлами конкретной архитектуры. В случае, например, простой нейронной сети прямого распространения глубина соответствует количеству слоев сети.

В частности, при тестах на коротких фрагментах текста первой книги о Гарри Поттере программа безошибочно ответила на вопрос «Что было секретом Дурслей?» выбрав среди вариантов «дрели», «Поттеры», «кошки умеющие читать» и «их маленький сын» ответ «Поттеры». Кроме того, проанализировав сцену сразу после распределения Гарри (финальные фразы Распределяющей шляпы не вошли в отрывок) алгоритм правильно ответил на вопрос «В какой из факультетов шляпа распределила Гарри??». Авторы отмечают, что ключевым в работе алгоритма является анализ текста на различных масштабах — от отдельных слов к словосочетаниям и предложениям. Для достижения такого эффекта программисты специальным образом настраивали нейросеть перед обучением. В результате этого, по словам разработчиков, процент правильных ответов оказался на 15 процентов выше, чем у других алгоритмов, основанных на глубоком обучении.

Система в первую очередь предназначена для автоматического анализа технических текстов, таких как инструкции по применению и патенты. Она может позволить компьютерам самостоятельно анализировать и «понимать» тексты, открывая новые пути для сбора данных.

Владимир Королёв