Опубликованы две научные системы на базе ИИ для помощи ученым: Co-Scientist от Google и Робин от FutureHouse. Оба инструмента генерируют гипотезы; один идет дальше и анализирует часть данных. — arstechnica.com
Во вторник журнал Nature опубликовал две статьи, описывающие системы на основе ИИ, предназначенные для помощи ученым в разработке и проверке гипотез. Одна из них, Co-Scientist от Google, спроектирована как то, что они называют «ученый в контуре» (scientist in the loop), что означает, что исследователи регулярно применяют свои суждения для направления системы. Вторая, от некоммерческой организации FutureHouse, идет на шаг дальше и обучила систему, способную оценивать биологические данные, поступающие от некоторых специфических классов экспериментов.
Хотя Google заявляет, что их система также подойдет для физики, обе группы представляют исключительно биологические данные и в основном простые гипотезы — этот препарат сработает для того. Таким образом, это не попытка заменить ни ученых, ни научный процесс. Вместо этого она призвана помочь с тем, в чем текущие ИИ наиболее сильны: переваривание огромных объемов информации, с которыми людям трудно справиться.
Для чего это полезно?
Существуют некоторые различия между двумя системами, но обе они являются так называемыми агентивными; они работают в фоновом режиме, обращаясь к отдельным инструментам. (Microsoft также применила схожий подход к своему научному ассистенту; OpenAI, похоже, является исключением, поскольку она просто настроила LLM для биологии.) И хотя между ними есть различия, которые мы подчеркнем, обе они сосредоточены на одной и той же общей проблеме: полнейшем изобилии научной информации.
С легкостью онлайн-публикаций количество журналов и, соответственно, статей взорвалось. Любому исследователю стало трудно оставаться в курсе событий в своей области. Поиск потенциально релевантного материала в других областях — настоящая проблема. Если вы, например, сосредоточены на развитии глаз, одна из сигнальных систем, используемых там, может быть задействована и в почках, и легко упустить то, что люди обнаруживают об этом в других местах.
,
Как отмечают сотрудники FutureHouse, «Сосредоточившись на «комбинаторном синтезе» (выявлении неочевидных связей между разрозненными областями), Робин эффективно нацеливается на «низко висящие фрукты», которые человеческие эксперты могут упустить из-за компартментализации научных знаний».
Это задача, хорошо подходящая для ИИ, который может переваривать рецензируемую литературу в фоновом режиме, пока исследователи занимаются другими делами. Здесь не стоит вопрос о том, может ли ИИ сделать что-то лучше или хуже человека; это скорее вопрос о том, будут ли вообще люди проводить подобные поиски.
Находя достаточно связей между разрозненными исследованиями, эти инструменты могут выдвигать предложения — по сути, гипотезы — о биологии. Это может включать такие вещи, как то, какие процессы лежат в основе биологического поведения, и какие пути и сети регулируют эти процессы. И в рассмотренных здесь случаях это включало предложение известных препаратов, которые могут воздействовать на некоторые из этих путей в больных клетках: острый миелоидный лейкоз в случае Google и форма макулярной дегенерации для FutureHouse.
Co-Scientist
Как вы можете себе представить, система Google основана на большой языковой модели Gemini компании. Это помогает системе интерпретировать изложение исследовательских целей, предоставленное учеными-людьми, и инициирует поиск литературы для нахождения релевантной информации и формирования гипотез. Затем они оцениваются друг относительно друга в «турнире», результаты которого оцениваются агентом Рефлексии (Reflection agent). Агент Эволюции (Evolution agent) затем может внести улучшения в любые выжившие идеи, которые могут быть отправлены обратно в процесс.
Ключевыми критериями, рассматриваемыми на протяжении всего этого процесса, являются правдоподобие, новизна, проверяемость и безопасность. И инструмент Рефлексии имеет доступ к внешним поисковым инструментам, поскольку доступ к научной литературе «предотвратил галлюцинации кажущихся новыми, но неправдоподобными гипотез», — написала компания.
,
Как указано в статье, ученые постоянно оставались в контуре. В поиске потенциальных препаратов, нацеленных на лейкемию, предложения системы приоритизировались на основе обзора группой экспертов, имевших доступ к литературе, которую Co-Scientist использовал для формулирования своих предложений.
Результаты таковы, каких можно ожидать от методов лечения рака. Некоторые из выявленных препаратов были эффективны, но только против подмножеств панели клеток миелоидного лейкоза. Это не редкость, учитывая, что существует несколько путей неконтролируемого роста, поэтому препараты, блокирующие путь, по которому следует один тип клеток, могут быть неэффективны в клетках, выбравших другой путь.
Google также упомянул, что система может проводить более общее выдвижение гипотез, не связанное с лекарствами, приведя в пример распространение генов вирулентности у бактерий. Но детали этой работы были довольно скудными.
Система также настроена так, что она агностична к моделям, что позволяет переключаться на более производительные модели по мере развития систем ИИ. Но они также предупреждают, что «Co-Scientist также наследует присущие ограничения своих базовых моделей, включая несовершенную фактичность и потенциал галлюцинаций».
И Робин
Система FutureHouse имеет некоторые сходства, но пару критических различий, которые выходят за рамки простого наименования всех агентивных инструментов в честь птиц. Основная система, Робин (Robin), имеет доступ к специализированным инструментам поиска по литературе. Один, Ворон (Crow), создает краткое резюме статей, а Сокол (Falcon) дает глубокий обзор информации, содержащейся в статье. В статье, описывающей систему, четко указаны преимущества: «Робин анализирует 551 статью за 30 минут по сравнению с расчетным временем 540 часов для человека».
,
Используя эти резюме, Робин затем сформировал серию гипотез о механизмах заболевания макулярной дегенерацией и использовал эти инструменты для предоставления подробного отчета о доказательствах для каждого механизма. Затем судья на базе LLM провел попарные сравнения гипотез, что привело к относительной ранжировке — немного похоже на турнирную систему Google.
Аналогичным образом система была развернута повторно для предложения клеточных линий и условий культивирования, которые могли бы смоделировать макулярную дегенерацию, и подготовила отчеты по 30 кандидатам в лекарства. «Эти отчеты содержали как обоснование того, почему каждый препарат подходит для смягчения механизма заболевания, представленного в in vitro модели, так и потенциальные ограничения, которые может создать препарат», — по словам команды FutureHouse. Опять же, эти отчеты были оценены экспертами-людьми для определения того, какие тесты следует проводить.
Робин также предложил анализы для проверки препаратов, которые были оценены людьми (в большинстве случаев, по-видимому, использовались варианты предложенных).
Ключевое отличие Робина в том, что он включает инструмент, Зяблик (Finch), который может автоматизировать оценку данных некоторых стандартных биологических скрининговых анализов, таких как проточная цитометрия и RNA-seq. Таким образом, если ваши тесты включают один из анализов, которые может обработать Зяблик, то система может выполнить дополнительный шаг.
Как и в случае с Google, Робин выдвинул новую гипотезу: повышение способности ретинальных клеток поглощать мусор вне клеток может обеспечить некоторую защиту от заболевания. И он выявил препарат, который, по-видимому, обеспечивал именно такой толчок в предложенных им экспериментах.
Как обнаружила Google, наличие инструментов, специально разработанных для взаимодействия с научной литературой, имело значение. Замена Ворона на o4-mini от OpenAI привела к увеличению доли галлюцинаций в ссылках с нуля до 45 процентов. FutureHouse также изучила производительность инструмента OpenAI, ориентированного на исследования, и обнаружила, что во всех случаях, когда он предлагал препараты, которые Робин не смог найти, эти препараты не оказывали воздействия на эти клетки.
,
Что это нам дает?
Для начала важно отметить, что эти успехи достигнуты в одной из более легких частей разработки лекарств (хотя ни одну часть нельзя назвать по-настоящему легкой). ИИ не просили разрабатывать совершенно новые молекулы, и большинство препаратов терпят неудачу на стадии испытаний на животных и клинических испытаний, а не на стадии тестирования на клеточных культурах. Это не значит, что перепрофилирование существующих препаратов — это пустяки — у нас уже есть профили безопасности и одобрения регулирующих органов для этих молекул, и многие из них не защищены патентами и, следовательно, дешевы. Но мы еще не достигли того момента, когда ИИ решает сложные задачи.
Такого рода гипотезы — этот механизм лежит в основе этой болезни, а тот препарат может нацелиться на него — также являются одной из наиболее конкретных форм гипотез в биологии. За свою карьеру ученого мне приходилось выдвигать гипотезы, призванные ответить на такие вопросы, как «у мышей с этой мутацией наблюдается множество дефектов в совершенно разных тканях; лежит ли в их основе единый механизм?» Или: «Что происходит на границе экспрессии этого гена, что меняет реакцию клеток на эту сигнальную молекулу?» Неясно, как эти системы справились бы с такими более открытыми научными проблемами.
Тем не менее, проблема перегрузки литературой реальна во многих областях, и системы, предназначенные для ее решения, могут потенциально помочь нам избежать ситуации, когда вся необходимая информация была доступна в течение десяти лет, но никто ее не собрал воедино. Учитывая, что мы все еще разбираемся с проблемами роста ИИ, я также рад, что существуют по крайней мере две независимо разработанные системы, решающие эту проблему, чтобы мы могли потенциально запустить обе и сравнить результаты.
Nature, 2026. DOI: 10.1038/s41586-026-10652-y, /10.1038/s41586-026-10644-y (О DOI).
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – John Timmer