Найти в Дзене
Станислав Барыкин

Виртуальная клетка из кремния: как ИИ пытается разгадать тайну жизни

Представьте себе город с населением в 42 миллиона жителей. Теперь сожмите его до размера точки. Именно столько белков суетится внутри одной человеческой клетки. Плюс углеводы. Плюс липиды. Плюс нуклеиновые кислоты. И всё это не просто существует рядом — оно непрерывно реагирует, перестраивается, общается. Можно ли такое скопировать? 🧬 Учёные считают, что да. И они уже пытаются. Человеческий мозг не справляется. Слишком много переменных. Слишком много связей. Тысячи генов включаются и выключаются каждую секунду, превращая кажущийся хаос в слаженный оркестр. Понять этот процесс — значит понять саму жизнь. Но есть кое-что, что умеет работать со сложностью лучше нас. Искусственный интеллект. После оглушительного успеха ChatGPT учёные задались вопросом: а что, если создать такой же прорыв для биологии? Не чат-бот, а виртуальную клетку — цифрового двойника, который учится сам, поглощая терабайты данных о реальных клетках. «Люди хотят такого же момента для биологии, как ChatGPT для текстов»
Оглавление

Представьте себе город с населением в 42 миллиона жителей. Теперь сожмите его до размера точки. Именно столько белков суетится внутри одной человеческой клетки. Плюс углеводы. Плюс липиды. Плюс нуклеиновые кислоты. И всё это не просто существует рядом — оно непрерывно реагирует, перестраивается, общается. Можно ли такое скопировать? 🧬

ИИ пытается разгадать тайну жизни
ИИ пытается разгадать тайну жизни

Учёные считают, что да. И они уже пытаются.

Зачем вообще копировать клетку?

Человеческий мозг не справляется. Слишком много переменных. Слишком много связей. Тысячи генов включаются и выключаются каждую секунду, превращая кажущийся хаос в слаженный оркестр. Понять этот процесс — значит понять саму жизнь.

Но есть кое-что, что умеет работать со сложностью лучше нас.

Искусственный интеллект.

После оглушительного успеха ChatGPT учёные задались вопросом: а что, если создать такой же прорыв для биологии? Не чат-бот, а виртуальную клетку — цифрового двойника, который учится сам, поглощая терабайты данных о реальных клетках.

Зачем копировать клетку?
Зачем копировать клетку?
«Люди хотят такого же момента для биологии, как ChatGPT для текстов», — говорит Касия Кендзерска, исследователь ИИ из Института Аллена.

Если это сработает, последствия будут колоссальными.

Что обещают виртуальные клетки?

Давайте пофантазируем. Точнее, послушаем, что планируют сами разработчики:

  • Фармацевтика: тестирование тысяч потенциальных лекарств без дорогих и долгих экспериментов на живых клетках 💊
  • Персонализированная медицина: модель клетки, настроенная под конкретного пациента, поможет врачу подобрать именно то лекарство, которое подойдёт именно ему
  • Биоинженерия: проектирование клеток с новыми функциями — например, бактерий, которые едят пластик или производят топливо
  • Онкология: виртуальные ткани и органы покажут, как опухоль взаимодействует с окружением
Что обещают виртуальные клетки?
Что обещают виртуальные клетки?

Звучит как научная фантастика? Возможно. Но первые шаги уже сделаны.

Краткая история цифровых клеток

Идея не нова. Ещё в 2012 году команда из Стэнфорда создала первую «целоклеточную модель» — виртуальную копию бактерии Mycoplasma genitalium. Выбрали её за простоту: всего 500 генов. Для сравнения, у кишечной палочки их больше 4000.

Модель рассчитывала концентрации 700 метаболитов в 1100 химических реакциях. Имитировала хромосому и рибосомы. Работала.

Но медленно.

В 2022 году появилась более продвинутая версия — трёхмерная модель минимальной бактериальной клетки. Детализация выросла. Вот только симуляция 20 минут жизни клетки занимала 8-10 часов работы мощнейших видеокарт. 😅

И главная проблема: эти модели следовали правилам, которые программисты задали вручную. Они не учились сами.

Новое поколение: ИИ берёт дело в свои руки

Современные модели устроены иначе. Они — как студенты, которым дали библиотеку вместо учебника.

Возьмём Geneformer. Эту систему обучили на данных об активности генов почти 30 миллионов человеческих клеток. Никаких готовых правил. Модель сама выявила закономерности и научилась предсказывать, что произойдёт, если «выключить» определённые гены.

Результат? Geneformer указал на гены, подавление которых может помочь при кардиомиопатии — болезни, при которой сердечная мышца слабеет. Эксперименты подтвердили: он был прав.

Другая модель — TranscriptFormer — пошла ещё дальше. Её обучили на данных 112 миллионов клеток от 12 разных видов: человек, мышь, нематода, губка, даже малярийный паразит. Эволюционная широта дала неожиданный бонус: модель научилась классифицировать клетки видов, которых вообще не видела во время обучения. 🔬

Новое поколение: ИИ берёт дело в свои рук
Новое поколение: ИИ берёт дело в свои рук

«Это показывает, как люди могут использовать такие инструменты для открытия фундаментальной биологии», — объясняет Теофанис Каралетсос из Chan Zuckerberg Initiative.

Но всё ли так гладко?

Здесь начинается самое интересное.

Несмотря на громкие заявления, критики настроены скептически. Алекс Лу из Microsoft Research прямо говорит: «Несмотря на хайп, модели недотягивают». Некоторые из них предсказывают не лучше простых математических формул.

Исследование, опубликованное в Nature Methods в августе, шокировало сообщество. Учёные сравнили пять передовых ИИ-моделей клеток с базовой математической формулой. Формула победила.

Да, вы правильно прочитали. Формула. 📉

нейроклетка
нейроклетка

«Я был очень удивлён. Судя по публикациям, модели выглядели отлично», — признаёт один из авторов исследования Константин Альман-Эльтце.

Почему так происходит?

Три главные проблемы виртуальных клеток

1. Данных всё ещё мало

Звучит парадоксально: база CELLxGENE содержит информацию о 35 миллионах клеток. Но для по-настоящему мощной модели этого недостаточно. Клетка — не текст. Здесь нужны данные о генах, белках, метаболитах, изображениях, взаимодействиях. А большинство моделей пока используют только один тип информации — активность генов.

2. Нет единого хранилища

Когда создавали AlphaFold — ту самую систему, которая научилась предсказывать структуру белков (и принесла Нобелевскую премию), — учёные опирались на Protein Data Bank. Там собраны почти все известные структуры белков в стандартном формате.

Для клеточных данных такого банка нет. Результаты разбросаны по разным источникам, в разных форматах.

3. Непонятно, как оценивать успех

Какой тест считать честным? Если модель дополнительно «натаскали» на конкретную задачу, показывает ли она реальное понимание биологии? Или просто выучила ответы?

проблемы виртуальных клеток
проблемы виртуальных клеток

Virtual Cell Challenge: соревнование, которое расставит точки

Чтобы разобраться, что работает, а что нет, учёные запустили масштабное состязание.

Более 1000 команд со всего мира соревнуются за призы от Nvidia и других спонсоров. Задача: предсказать, что произойдёт с эмбриональными стволовыми клетками человека, если «выключить» определённые гены.

Команды с названиями вроде Cellamander, SmartCell и Mean Predictors борются за главный приз — 100 000 долларов и время на мощнейших GPU.

Результаты объявят 6 декабря. 🏆

«Мы хотим узнать, что работает, а что нет», — говорит организатор Хани Гударзи из Arc Institute.

Что дальше?

Скептики не хоронят идею виртуальных клеток. Они просто указывают на дистанцию между обещаниями и реальностью.

Касия Кендзерска формулирует это так:

«Я бы не отказывалась от этих моделей. Их неудачи дают нам массу информации».

А Теофанис Каралетсос с улыбкой добавляет про TranscriptFormer:

«Это самая глупая модель, которую мы когда-либо создадим».

Имея в виду, конечно, что следующие будут умнее.

Почему это важно для вас?

Допустим, вы не биолог и не программист. Зачем вам знать о виртуальных клетках?

Представьте мир, где новое лекарство от рака тестируют не годами на мышах и добровольцах, а за недели на цифровых моделях. Где ваш врач загружает ваш генетический профиль в систему и получает персональный план лечения. Где болезни побеждают не методом проб и ошибок, а точным расчётом.

Это уже не фантастика.
Это уже не фантастика.

Это не завтра. Но это уже не фантастика.

А пока — следите за результатами Virtual Cell Challenge. Декабрь покажет, насколько мы близки к этому будущему. 🚀

А как вы думаете: сможет ли ИИ когда-нибудь полностью «понять» живую клетку? Или природа всегда будет на шаг впереди?