Программа Semantic Scholar, анализирующая миллионные базы данных научных статей, на днях назвала десятку влиятельнейших нейробиологов, трое из которых работают в Университетском колледже Лондона (UCL). Но можно ли верить программе и способен ли могучий ИИ ошибаться?
Semantic Scholar: ИИ назвал самых влиятельных нейробиологов

Когда дело доходит до нейронаучных исследований, University College London (UCL) есть чем похвастаться. Это не просто мнение человека, это вывод компьютерной программы, которая в настоящее время анализирует содержание 2,5 миллионов статей, связанных с неврологией, проводит между ними параллели и оценивает влияние каждого автора на остальных. Из 10 самых влиятельных ученых трое оказались из UCL. В чем секрет? По словам Криса Фрита, занимающего седьмое место в списке, они раньше других смогли визуализировать мозговую деятельность, тем самым значительно упростив себе работу, что и позволило ученым первым совершать открытия.

Программа, называемая Semantic Scholar, представляет собой сетевой алгоритм, разработанный в Институте искусственного интеллекта Пола Аллена, США. Во время презентации в апреле этого года, программа вычисляла наиболее влиятельных ученых в области программирования, работа я массивом в 2 миллиона статей. В настоящее время в базе данных Semantic Scholar находятся уже 10 миллионов текстов, при этом 25% посвящены изучению работы мозга и нервой системы. В следующем году команда разработчиков надеется расширить базу до 20 миллионов статей, включив в нее материалы по биомедицинской литературе.

Когда программа находит в Интернете материал, то, будучи активно обучающимся ИИ, видит в нем намного больше, чем типичный составитель картотеки: в поле внимания системы попадают не только банальные библиографические данные автора, но и конкретная информация — типы клеток, методы исследования, ссылки на других авторов. По словам Сэма Гершмана, вычислительного нейробиолога из Гарвардского университета, это очень мощный инструмент, который в настоящее время на голову превосходит все существующие аналоги. Однако и он не лишен недостатков: проблема, впрочем, кроется в самих ученых, которые не всегда одинаково названы в своих и чужих работах, что приводит программу в замешательство. Кроме того, метаданные порой допускают забавные ошибки: так, одна из работ Гершмана датируется 1987 годом — в это время ученому было всего 2 года.

Помимо этого, Сэма озадачили параметры, по которым система определяет влиятельность того или иного ученого. «Иногда Semantic Scholar выдает очень странные результаты. К примеру, ни одна из самых влиятельных статей Томаса Гриффитса (психолог из Университета Беркли) не попадает в первую пятерку наиболее цитируемых авторов, хотя это очевидно так», говорит он.

Впрочем, сами ученые из UCL не страдают от лишней скромности и указывают на то, что в целом система совершенно права. Вся тройка начинала работать вместе в конце 1980-х годов и, по словам Фрита, их работы в самом деле пользовались огромным авторитетом у научного сообщества. Впрочем, Карл Фристон, занявший первое место, относится к выбору Semantic Scholar со скептическим юморком, заявляя, что его «первой мыслью было то, кому же я могу рассказать об этом? Ведь меня сразу сочтут хвастуном, и будут абсолютно правы! Тогда я понял, что единственные люди, которые смогут понять меня и гордиться выбором программы, будут мои дети».