Найти в Дзене

Нейросети помогут биологам создавать белки для борьбы с раком, гриппом и Covid

Прошлой весной лаборатория искусственного интеллекта OpenAI представила DALL-E, сервис, способный рисовать изображение по текстовому описанию. Следом появились Midjourney и Stable Diffusion, вызвавшие огромную шумиху из-за угрозы оставить художников без работы и засилья дипфейков.

Но некоторые ученые рассматривают эту технологию, как нечто большее, чем просто способ создания поддельных фотографий. Они видят путь к лечению рака, к новой вакцине против гриппа или лекарстве, помогающем усваивать глютен.

Используя методы, лежащие в основе DALL-E и других генеративных нейросетей, эти ученые создают чертежи новых белков — крошечных биологических механизмов, которые могут изменить поведение нашего организма.

Наше тело естественным образом вырабатывает около 20 000 белков, которые отвечают за все процессы, от переваривания пищи до перемещения кислорода по кровотоку. Теперь исследователи работают над созданием белков, не встречающихся в природе, в надежде улучшить нашу способность бороться с болезнями и делать то, что наш организм естественным образом не умеет.

Дэвид Бейкер, директор Института белкового дизайна Вашингтонского университета, работает над созданием искусственных белков уже более 30 лет. К 2017 году он и его команда уже доказали, что это возможно. Но никто не ожидал, что появление новых технологий искусственного интеллекта внезапно ускорит эту работу, сократив время, необходимое для создания новых чертежей, с нескольких лет до недель.

Людям нужны новые белки, чтобы справиться с раком и вирусными пандемиями, эволюцию ждать некогда.

-2

Благодаря методам DALL-E новые белки могут быть созданы с нуля, подобно цифровым фотографиям. Одна из самых мощных особенностей этой технологии заключается в том, что, как и DALL-E, она делает то, что ей говорят. Из одной подсказки можно создать бесконечное количество дизайнов.

Расцвет OpenAI

Для создания изображений DALL-E опирается на математическую систему, грубо смоделированную на основе сети нейронов в мозгу. Аналогичная технология распознает команды голосовыми помощниками и помогает автопилоту автомобиля избегать пешеходов.

Белки начинаются как цепочки химических соединений, которые затем скручиваются и складываются в трехмерные формы, определяющие их поведение. В последние годы лаборатории искусственного интеллекта, такие как DeepMind, показали, что нейронные сети могут точно угадывать трехмерную форму любого белка в организме, основываясь только на меньших соединениях, которые он содержит.

Следующий шаг - использовать эти системы для создания чертежей совершенно новых белков, не существующих в природе. Цель состоит в том, чтобы создать белки, которые принимают очень специфическую форму; определенная форма может служить определенной задаче, например, борьбе с вирусом, вызывающим Covid.

Подобно тому, как DALL-E использует взаимосвязь между подписями и фотографиями, аналогичные системы могут использовать взаимосвязь между описанием того, что может делать белок, и формой, которую он принимает. Исследователи могут создать грубую схему белка, который им нужен, а затем модель диффузии создаст его трехмерную форму.

Модель диффузии белка, выполняющая безусловную генерацию, преобразовывающую шум в правдоподобные структуры
Модель диффузии белка, выполняющая безусловную генерацию, преобразовывающую шум в правдоподобные структуры

Белковые инженеры могут запросить белок, который связывается с другим определенным образом, и генеративная модель может его построить. Разница в том, что человеческий глаз может мгновенно оценить точность изображения DALL-E, но не может сделать то же самое со структурой белка. После того, как технологии искусственного интеллекта создадут эти белковые чертежи, ученые должны отправить их в лабораторию, где можно проводить эксперименты с реальными химическими соединениями, и убедиться, что они делают то, что должны делать.

И всё же новые методы не просто ускоряют создание новых белков-кандидатов. Они предоставляют способ изучения инноваций, которые исследователи ранее не могли исследовать самостоятельно.