Основанная на ИИ система успешно спланировала и провела реальные химические эксперименты, показав, что потенциально способна помочь людям-учёным делать больше открытий и быстрее.
За меньшее время, чем вам понадобится, чтобы прочитать эту статью, система под управлением искусственного интеллекта смогла автономно обучиться определенным химических реакциям, получившим Нобелевскую премию, и разработать успешную лабораторную процедуру для их проведения. ИИ сделал всё это всего за несколько минут — и добился успеха с первой попытки.
«Это первый случай, когда неорганический разум спланировал, спроектировал и осуществил эту сложную реакцию, изобретенную людьми», — говорит химик-технолог из Университета Карнеги-Меллона Гейб Гомес, который возглавлял исследовательскую группу, которая собрала и протестировала систему на основе ИИ. Они окрестили своё творение «Coscientist» («соучёный» — прим. перев.).
Самые сложные реакции, которые реализовал Coscientist, известны в органической химии как кросс-сочетания, катализируемые палладием, благодаря которым изобретатели получили Нобелевскую премию по химии 2010 года в знак признания огромной роли, которую эти реакции стали играть в процессе разработки фармацевтических препаратов и других отраслях, где используются привередливые молекулы на основе углерода.
Опубликованные в журнале Nature, продемонстрированные Coscientist способности показывают, что люди могут продуктивно использовать ИИ для увеличения темпов и количества научных открытий, а также для улучшения воспроизводимости и надёжности экспериментальных результатов. В исследовательскую группу из четырех человек входят аспиранты Даниил Бойко и Роберт Макнайт, получившие поддержку и обучение в Центре химиоферментного синтеза Национального научного фонда (NSF — прим. перев.) США при Северо-Западном университете и Центре компьютерного синтеза NSF при Университете Нотр-Дам соответственно.
«Помимо задач по химическому синтезу, продемонстрированных их системой, Гомес и его команда успешно синтезировали своего рода сверхэффективного лабораторного партнёра», — говорит директор химического отдела NSF Дэвид Берковиц. — Они сложили все части вместе, и конечный результат представляет собой нечто гораздо большее, чем просто сумму его частей — его можно использовать для действительно полезных научных целей».
Сборка Coscientist
Главной составляющей среди программного обеспечения и кремниевых элементов Coscientist являются большие языковые модели, составляющие его искусственный «мозг». Большая языковая модель — это тип ИИ, который может извлекать смысл и закономерности из огромных объёмов данных, включая рукописный текст, содержащийся в документах. Выполнив ряд задач, команда протестировала и сравнила несколько больших языковых моделей, включая GPT-4 и другие версии больших языковых моделей GPT, созданные компанией OpenAI.
Coscientist также был оснащён несколькими различными программными модулями, которые команда протестировала сначала индивидуально, а затем совместно.
«Мы пытались разбить все возможные научные задачи на маленькие части, а затем по частям построить большую картину», — говорит Бойко, который разработал общую архитектуру Coscientist и его экспериментальные задания. «В конце концов, мы собрали всё вместе».
Программные модули позволяли Coscientist делать то, что делают все химики-исследователи: искать общедоступную информацию о химических соединениях, находить и читать технические руководства по управлению роботизированным лабораторным оборудованием, писать компьютерный код для проведения экспериментов и анализировать полученные данные, чтобы определить, что сработало, а что нет.
В одном тесте проверялась способность Coscientist точно планировать химические процедуры, которые, если бы они были выполнены, привели бы к получению широко используемых веществ, таких как аспирин, ацетаминофен и ибупрофен. Большие языковые модели были индивидуально протестированы и сравнены, включая две версии GPT с программным модулем, позволяющим использовать Google для поиска информации в Интернете, как это мог бы делать человек-химик. Полученные процедуры затем были проверены и оценены в зависимости от того, привели ли они к желаемому веществу, насколько подробными были предпринимаемые шаги и других факторов. Одни из самых высоких оценок получил модуль GPT-4 с функцией поиска, который оказался единственным, создавшим процедуру приемлемого качества для синтеза ибупрофена.
Бойко и Макнайт наблюдали, как Coscientist демонстрирует «химическое мышление», которое Бойко описывает как способность использовать связанную с химией информацию и ранее приобретенные знания для руководства своими действиями. Он использовал общедоступную химическую информацию, закодированную в формате Системы упрощённого представления молекул в строке (SMILES) — типа машиночитаемой записи, представляющей химическую структуру молекул — и вносил изменения в свои экспериментальные планы на основе конкретных частей молекул, которые он анализировал на основании данных SMILES. «Это лучшая из возможных версий химического мышления», — говорит Бойко.
Дальнейшие испытания включали программные модули, позволяющие Coscientist искать и использовать техническую документацию, описывающую интерфейсы прикладного программирования, которые управляют роботизированным лабораторным оборудованием. Эти тесты сыграли важную роль в определении того, сможет ли Coscientist перевести свои теоретические планы синтеза химических соединений в компьютерный код, который будет направлять лабораторных роботов в физическом мире.
Приведите роботов
Высокотехнологичное роботизированное химическое оборудование обычно используется в лабораториях, чтобы снова и снова всасывать, впрыскивать, нагревать, взбалтывать и выполнять другие действия с крошечными образцами жидкости с высочайшей точностью. Такие роботы обычно управляются с помощью компьютерного кода, написанного химиками-людьми, которые могут находиться в той же лаборатории или на другом конце страны.
Это было первым случаем управления такими роботами компьютерным кодом, написанным ИИ.
Исследователи сначала дали Coscientist простые задания, где требовалось, чтобы роботизированный аппарат для обработки жидкостей распределил цветную жидкость в планшет с 96 небольшими лунками, расположенными в виде сетки. Было предложено «раскрасить каждую вторую линию одним цветом по вашему выбору», «нарисовать синюю диагональ» и выполнить другие задания, напоминающие детский сад.
После окончания базового курса по переработке жидкостей команда познакомила Coscientist с другими типами роботизированного оборудования. Они сотрудничали с Emerald Cloud Lab, коммерческим предприятием, оснащённым различными типами автоматизированного оборудования, включая спектрофотометры, которые измеряют длины волн света, поглощаемого химическими образцами. Затем Coscientist дали планшет, содержащий жидкости трёх разных цветов (красного, желтого и синего), и попросили определить, какие цвета присутствовали и где они находились на планшете.
Поскольку у Coscientist нет глаз, он написал код, который автоматически передавал планшет загадочного цвета на спектрофотометр и анализировал длины волн света, поглощаемые каждой лункой, таким образом определяя имеющиеся цвета и их расположение на пластинке. Для этого задания исследователям пришлось немного подтолкнуть Coscientist в правильном направлении, поручив ему подумать о том, как разные цвета поглощают свет. Остальное сделал ИИ.
Заключительным экзаменационным заданием Coscientist было объединить собранные модули и полученные знания чтобы выполнить команду учёных «провести реакцию Сузуки и Соногаширы», названную в честь их изобретателей Акиры Судзуки и Кенкичи Соногаширы. В реакциях, открытых в 1970-х годах, металлический палладий катализирует связи между атомами углерода в органических молекулах. Эти реакции оказались чрезвычайно полезными при создании новых видов лекарств для лечения воспалений, астмы и других состояний. Они также используются в органических полупроводниках в органических светодиодах, используемых во многих смартфонах и мониторах. Революционные реакции и их широкое влияние были официально признаны Нобелевской премией, совместно присуждённой в 2010 году Судзуки, Ричарду Хеку и Эй-ити Нэгиси.
Разумеется, Coscientist до этого никогда не пытался провести эти реакции. Поэтому, он поступил так же, как и автор при написании предыдущего параграфа — он зашёл на Википедию и нашёл их там.
Coscientist использует роботизированный манипулятор жидкостей.
Великая сила, большая ответственность
«Для меня моментом «эврики» стало то, что он задал все правильные вопросы», — говорит Макнайт, который разработал программный модуль, позволяющий Coscientist искать техническую документацию.
Coscientist искал ответы преимущественно в Википедии, а также на множестве других сайтов, включая сайты Американского химического общества, Королевского химического общества и других, содержащих научные статьи, описывающие реакции Судзуки и Соногаширы.
Менее чем за четыре минуты Coscientist разработал точную процедуру проведения необходимых реакций с использованием химикатов, предоставленных учёными. Когда он попытался выполнить процедуру в физическом мире с помощью роботов, он допустил ошибку в коде, который написал для управления устройством, которое нагревает и взбалтывает образцы жидкости. Без подсказок со стороны людей Coscientist обнаружил проблему, обратился к техническому руководству к устройству, исправил свой код и повторил попытку.
Результаты содержались в нескольких крошечных образцах прозрачной жидкости. Бойко проанализировал образцы и обнаружил спектральные признаки реакций Судзуки и Соногаширы.
Гомес не поверил, когда Бойко и Макнайт рассказали ему, что сделал Coscientist. — Я подумал, что они водят меня за нос», — вспоминает он. «Но — нет. Абсолютно нет. И в этот момент выстрелило: отлично, у нас здесь есть что-то очень новое, очень мощное».
С этой потенциальной мощью возникает необходимость использовать её разумно и защищать от злоупотреблений. Гомес говорит, что понимание возможностей и ограничений ИИ — это первый шаг в разработке обоснованных правил и политик, которые смогут эффективно предотвращать вредительское использование ИИ, будь оно преднамеренным или случайным.
«Нам нужно ответственно и внимательно отнестись к тому, как будут использоваться эти технологии», — говорит он.
Гомес — один из нескольких исследователей, предоставляющих экспертные консультации и рекомендации правительству США для мер по обеспечению безопасного и надежного использования ИИ, таких как указ администрации Байдена о разработке ИИ от октября 2023 года .
Ускорение открытий, демократизация науки
Мир природы практически бесконечен по своим размерам и сложности и содержит неисчислимые открытия, которые только и ждут, чтобы их совершили. Представьте себе новые сверхпроводящие материалы, которые значительно повышают энергоэффективность, или химические соединения, которые излечивают неизлечимые болезни и продлевают человеческую жизнь. И всё же получение образования и подготовки, необходимых для совершения этих прорывов, — это долгий и трудный путь. Стать учёным сложно .
Гомес и его команда рассматривают системы с поддержкой искусственного интеллекта, такие как Coscientist, как решение, которое может преодолеть разрыв между неизведанными просторами природы и тем фактом, что квалифицированных учёных не хватает — и, вероятно, всегда будет не хватать.
У учёных-людей также есть человеческие потребности, такие как сон и иногда выход за пределы лаборатории. Тогда как управляемый человеком ИИ может «думать» круглосуточно, методично заглядывая в каждый пресловутый угол, проверяя и перепроверяя свои экспериментальные результаты на предмет воспроизводимости. «У нас может быть что-то, что может работать автономно, пытаясь открыть новые явления, новые реакции, новые идеи», — говорит Гомес.
«Также можно значительно снизить входной барьер практически в любой области», — говорит он. Например, если биолог, не обученный реакциям Судзуки, захочет попытаться использовать их по-новому, он может попросить Coscientist помочь ему спланировать эксперименты.
«Можно добиться массовой демократизации ресурсов и понимания», — объясняет он.
В науке есть циклический процесс попыток, неудач, обучения и совершенствования, который ИИ может существенно ускорить, говорит Гомес. «Это само по себе будет кардинальным изменением».
Автор — Джейсон Стоутон, сотрудник отдела научных коммуникаций Национального научного фонда.
Перевод — Андрей Прокипчук, «XX2 ВЕК».
Вам может быть интересно: