Почему огромная база из 370 000 белков, созданная нейросетью, может изменить фундаментальную науку

Ученые обнародовали самую исчерпывающую базу данных о белках, которые формируют «строительные блоки» жизни, что должно «коренным образом изменить образ биологических исследований».
Почему огромная база из 370 000 белков, созданная нейросетью, может изменить фундаментальную науку

Нейросеть за пару часов удвоила результаты работы, на которую исследователи потратили больше 50 лет

Каждая клетка в каждом живом организме начинает выполнять свои функции только по команде белков, которые постоянно доставляют организму самые разные инструкции – от поддержания здоровья до борьбы с инфекцией. В отличие от генома (полной последовательности генов человека, кодирующих клеточную жизнь) протеом человека (то есть совокупность белков) постоянно изменяется в ответ на генетические «инструкции» и стимулы окружающей среды.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Понимание того, как работают белки внутри клеток, было и остается одной из главных целью ученых на протяжении десятилетий. Однако определение точной функции каждого белка с помощью прямых экспериментов — дело кропотливое.

За пятьдесят лет исследований было изучено только 17% аминокислот (то есть субъединиц белков) протеома человека. Но недавно исследователи из Google DeepMind и Европейской лаборатории молекулярной биологии (EMBL) обнародовали базу данных из 20 000 белков, экспрессируемых геномом человека, которая находится в свободном и открытом доступе в Интернете.

В набор также включены более 350 000 белков из 20 организмов, таких как бактерии, дрожжи и мыши, на которых ученые чаще всего полагаются в своих исследованиях.

Нажми и смотри

Для создания базы данных команда использовала современную программу машинного обучения, которая смогла точно предсказать форму белков на основе их аминокислотных последовательностей. Вместо того, чтобы тратить месяцы на оборудование стоимостью в несколько миллионов долларов, они обучили свою систему AlphaFold работе с базой данных из 170 000 известных белковых структур.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Затем ИИ использовал алгоритм для точного предсказания формы 58% всех белков в протеоме человека. Это более чем вдвое увеличило количество высокоточных белковых структур нашего организма. Результаты полувековых экспериментов, по сути, были удвоены в одночасье.

Возможности применения новой базы огромны: от исследования генетических заболеваний и борьбы с противомикробной устойчивостью до создания более засухоустойчивых культур. Ученые уверены, что в будущем такой мощный инструмент полностью изменит сам подход к исследованиям биологических аспектов жизни на нашей планете.

Max.Brown
Max.Brown 29 Июля 2021, 12:15
Странно и настораживающе, что для этой работы потребовалась нейросеть. Странно потому, что я-то думал, будто на основании законов физики процесс генерации белка из аминокислотной последовательности можно однозначно смоделировать тупым алгоритмом. Настораживающе потому, что "предсказание" чего-либо нейросетью неоднозначно и наверняка где-то содержит ошибки. А проверить 20К белков - задача столь же трудоёмкая, что и построить их вручную. В итоге получаем массив непроверенной информации, на основании которого собираемся делать выводы о функционировании человеческого организма, синтезировать лекарства и т.д.