В прошлом году грантовую поддержку от фонда «Интеллект» стали получать 5 молодых ученых, работающих в МГУ. Одна из них – кандидат химических наук Анастасия Смирнова. Она использует методы ИИ для поиска уязвимостей и определением границ применимости моделей лекарственных соединений. О том, как в наши дни разрабатываются новые препараты и с какими сложностями сталкиваются ученые, читайте в интервью с победительницей конкурса грантовой поддержки Анастасией Смирновой.
– Анастасия, как происходит разработка лекарств при помощи ИИ?
– Для лечения заболевания в первую очередь ищется лекарственная мишень. Чаще всего это белок, подействовав на который можно получить нужный терапевтический эффект, грубо говоря, остановить развитие заболевания или даже вылечить пациента. Поэтому часто разработка лекарственного средства связана с поиском молекулы, которая сможет провзаимодействовать с мишенью, то есть «включит» хороший или «выключит» плохой белок. Но проблема в том, что число всех подобных малых органических молекул сегодня оценивается как десять в шестидесятой степени, если мы даже установим какие-то дополнительные критерии поиска, число потенциальных кандидатов все еще будет оцениваться тысячами возможных структур. И здесь важно, как и не пропустить нужную молекулу, так и придумать, как не синтезировать и исследовать все тысячи вариантов. Простой перебор не подойдет из-за огромного количества времени и материальных ресурсов. И тут на помощь приходят методы искусственного интеллекта – часто этот этап разработки лекарства представляют как широкую воронку с узким горлом, которая позволяет отсеять точно не подходящие молекулы и сильно сузить набор рассматриваемых кандидатов еще до этапа химического синтеза. Тогда к этапу синтеза и доклинических испытаний остается одна-две сотни соединений.
– Какие методы для этого используются?
– Основной подход на этом этапе – высокопроизводительный скрининг, который заключается в тестировании больших библиотек возможных молекул на их способность взаимодействия с биологической мишенью. С одной стороны, на этом шаге возможно оценить ряд физико-химических свойств, которые критически важны для будущего лекарства, например, его растворимость или токсичность.
С другой стороны, на основе такого скрининга может выполняться и компьютерный дизайн лекарства, который способен выявить новые химические структуры, обладающие нужными биологическими, химическими и физическими свойствами. Так, например, сегодня известно пока только одно лекарство, созданное с использованием ИИ и прошедшим первую стадию клинических испытаний, так вот для ее создания использовалась генеративно-состязательная сеть (GAN).
– Какие риски связаны с методом создания лекарств при помощи ИИ?
– Нужно понимать, что лекарства, предложенные с помощью методов искусственного интеллекта, все равно проходят все стадии клинических испытаний, поэтому риски для пациентов точно такие, как и при разработке лекарств без использования ИИ. Поэтому я бы сказала, что уязвимости моделей и особенности их работы, которые могут приводить к неправильной молекуле-кандидату, связаны в первую очередь с финансовыми и временными потерями фармакологических компаний.
– Что вы исследуете в рамках своей научной работы, поддерживаемой фондом?
– Моя работа связана с вредоносным или состязательным машинным обучением применительно к моделям, использующимся для разработки новых лекарств. Сегодня сверточные нейронные сети являются наиболее перспективными в применении к химическим данным. Однако оказывается, что они малоустойчивы к небольшим возмущениям. Один из самых известных примеров, наверное, когда при добавлении неуловимого для человеческого глаза шума к картинке панды, модель интерпретирует результат как изображение гиббона (рис.).
Если переходить от картинок животных к молекулам, то возникает следующая проблема. Как уже было сказано выше, при создании новых лекарств на первом этапе используются методы машинного обучения для поиска или дизайна молекул с заданными свойствами. Однако предложенные соединения практически всегда претерпевают дальнейшие модификации структуры, например, заменяются отдельные функциональные группы. Это связанно с требованиями, предъявляемыми к молекуле в каждой конкретной задаче (токсичность, сила связывания с молекулой белка или фермента, и т.д.). Но может ли такая замена, которая по своей сути является небольшим изменением исходных данных, привести к неправильной работе модели и предсказанию неверного результата для новой молекулы? Какие структурные изменения молекулы смогут «сделать из панды гиббона»? Именно на эти вопросы я и ищу ответы в своем исследовании, оценивая границы применимости моделей и их устойчивости по отношению к малым изменениям в структуре целевых молекул. Вторая часть работы уже связана непосредственно с разработкой алгоритма активного обучения, который позволит модели дообучаться для устранения уязвимостей.
– Как вы пришли к этой теме?
– Я работаю в лаборатории Интеллектуального химического дизайна, и в нашей научной группе занимаются различными исследованиями с использованием сверточных графовых нейронных сетей для разных химических задач. Однако устойчивость таких моделей к малым возмущениям пока не была широко изучена. Что касается выбора именно направления, связанного с разработкой лекарств, то тут две причины – моральная и практическая. Практическая связана с наличием нескольких больших наборов данных молекул, открытых для использования. Что касается второй причины, то при разработке лекарств именно такие уязвимости в моделях искусственного интеллекта могут дорого обойтись как фармакомпаниям, так и пациентам.
– Какими еще исследованиями занимаетесь?
– Я окончила кафедру радиохимии химического факультета МГУ, поэтому ряд исследований связан непосредственно с этой областью, в частности, с химией ядерно-топливного цикла. Конкретно моя работа связана с разработкой подходов по определению устойчивости органических молекул к радиоактивному облучению. Такие молекулы, лиганды, используются для разделения металлов из отработавшего ядерного топлива, однако так как разделяемые компоненты имеют высокую радиоактивность, то молекулы, которые используются для процесса разделения, должны выдерживать большую дозовую нагрузку. Мы первыми предложили модель, которая на основе только молекулярной формулы, картинки молекулы, может оценить ее устойчивость. Второе направление, в котором мы сейчас работаем, это оценка устойчивости к радиоактивному излучению твердых матриц, в которые перед захоронением включаются радиоактивные отходы. Такие матрицы должны оставаться устойчивыми в течение нескольких тысяч лет, а потому экспериментально проверить нужные свойства невозможно. В обоих случаях мы используем модели, которые строятся на основе квантовой химии и молекулярной динамики, к сожалению, применение искусственного интеллекта в этих задачах не так очевидно из-за малого количества данных для обучения. Но в этом направлении мы тоже работаем.
– Нужно ли современному ученому уметь использовать ИИ и почему?
– Думаю, что да. Простые системы, для которых можно написать все физические и химические процессы в виде формул и уравнений и легко решить поставленную задачу, сегодня мало кому интересны. Реальные процессы, изучением которых занимаются ученые, это многопараметрические системы, и учесть все влияющие на систему факторы просто невозможно. Кроме того, ученым доступен широкий спектр различных методов, которые дают большое количество данных, их не всегда возможно за разумное время проанализировать одному человеку или даже группе людей. Здесь на помощь и приходят методы искусственного интеллекта, которым не нужно объяснять все происходящее в системе, корреляции ИИ способен найти самостоятельно. Более того, иногда это те корреляции, которые человеческий глаз не способен заметить.
– Анастасия, вы на профессиональном уровне занимаетесь спортом. Как считаете, есть ли какие-то точки пересечения у спорта и науки?
– Сложный вопрос. С одной стороны, в спорте приходится очень быстро принимать решения, в науке же наоборот, решения должны быть взвешенными, проверенными, нужно очень внимательно анализировать результаты. Но, с другой стороны, и в науке, и в спорте есть место творчеству, проявлению нестандартных тактик и подходов, которые помогут или обыграть соперника, или сделать важное научное открытие.