В лаборатории искусственного интеллекта в химии и молекулярной инженерии Томского госуниверситета (ТГУ) и Института AIRI завершилась уникальная гибридная стажировка, задача которой — подготовить химиков, умеющих применять методы искусственного интеллекта для научных задач. На финальной защите стажёры представили проекты, посвящённые новой терапии против рака, разработке антивирусных препаратов, адресной доставки лекарств и поиска лекарственного сырья естественного происхождения.
Попасть в число стажёров можно было после конкурсного отбора. На одно место претендовало более трёх кандидатов. Эксперты отобрали 20 человек — это в основном студенты и аспиранты ТГУ и Томского политеха. С сентября по декабрь включительно они изучали машинное обучение и нейронные сети для химии и фармакологии, получали менторскую поддержку от ведущих специалистов AIRI и ТГУ. Занятия проходили очно и в дистанционном формате. AIRI предоставило четырёх экспертов для чтения лекций и консультаций проектов. Программу стажировки со стороны ТГУ курировали завлабораторией Александр Бузаев, завкафедрой неорганической химии Людмила Борило, завкафедрой природных соединений, фармацевтической и медицинской химии Ирина Курзина.
По словам экспертов AIRI, их впечатлил общий уровень студентов — несмотря на небольшой срок обучения и работы над проектами, многие стажеры достигли отличных результатов. Так, они освоили работу с молекулярными дескрипторами, методами машинного обучения, графовыми нейронными сетями. Всё это нужно для предварительного выбора молекул, подходящих для лечения заболеваний. У многих получилось запустить инструменты докинга — они позволяют оценивать, как хорошо конкретная молекула связывается с целевым белком в организме человека. Также студенты научились применять открытые инструменты ретросинтеза — они позволяют создать путь синтеза из доступных исходных химических реагентов.
Кроме того, молодые учёные использовали методы генеративного искусственного интеллекта. Например, они создали новые наборы данных с молекулами, имеющими заданные свойства. Также стажёры успешно применили большие языковые модели для обработки текстов с химической информацией и сбора новых наборов данных из открытых источников.
«Мы ставили перед собой амбициозную задачу: всего за три месяца научить химиков эффективно работать с современными инструментами ИИ. Результаты превзошли наши ожидания. Под руководством сотрудников лаборатории и партнёров из AIRI участники освоили сложные технологии и успешно применили их к реальным научным задачам. Особенно поразила скорость, с которой стажеры овладели новыми навыками», — комментирует куратор стажировки со стороны ТГУ Александр Бузаев.
По его словам, в общей сложности за время стажировки молодые ученые проанализировали 2 миллиона молекул и сформировали датасеты для обучения нейросетевых моделей.
«2 миллиона молекул - это как собрать библиотеку из 2 миллионов томов, где каждая книга описывает уникальное химическое соединение. Такой объём данных позволяет ИИ “увидеть” закономерности, которые человеку сложно обнаружить в таком массиве. Ученый может “положить” всю свою карьеру на эту задачу. Применение ИИ в десятки раз ускоряет эти аналитические процессы, что критически важно для специалистов работающих над созданием новых лекарств или материалов», — объясняет Александр Бузаев.
Как прокомментировал проректор ТГУ по научной и инновационной деятельности Александр Замятин, прошедшая стажировка — наглядный пример того, как меняется роль современного учёного.
«Сегодня уже недостаточно измерять результативность исключительно статьями и научной новизной. Стране нужны технологии и продукты, а значит, исследователь должен уметь работать с инструментами, которые позволяют ускорять путь от идеи к практическому результату. Особенно важно, что в таких проектах молодые учёные учатся мыслить не только как исследователи, но и как разработчики будущих продуктов. Такой подход сегодня определяет конкурентоспособность науки и университетов в целом».
Проекты студентов
В течение обучения студенты делали собственные проекты, решающие актуальные научные задачи. До финальной защиты дошли четыре проекта с фармакологическим приложением.
Проект «KAT5/KAT8 inhibitors» посвящен поиску новых лекарственных молекул, используемых в лечении онкологических заболеваний. Авторы проекта разрабатывают датасет для ML-моделей, которые позволят предсказывать эффективность перспективных молекул против раковых клеток.
В рамках проекта «FloraChem» молодые учёные проанализировали количественные характеристики большой группы растительных соединений — каротиноидов и флавоноидов — с целью поиска перспективных молекул для косметики и лекарств.
Проект «Противовирусные молекулы» предполагает создание генератора новых соединений, сбор и верификацию набора данных, а также классификацию активности молекул против короновируса, гриппа, ВИЧ.
Проект «ChitoMed» посвящён формированию вычислительного датасета по свойствам соединений хитозана. Биополимеры из хитозана способны накапливать лекарственные препараты и медленно высвобождать их в организм. За счёт этого можно адресно доставлять лекарственные вещества в повреждённую область. Что создаёт возможности для разработки нового поколения протезов и имплантов.
Проекты оценила комиссия в составе экспертов из науки и индустрии. Они дали развёрнутую обратную связь по каждой работе, сформулировали рекомендации по дальнейшей доработке проектов и обозначили возможные пути внедрения результатов в практику.
«Все четыре финальных проекта обладают реальным научным и прикладным потенциалом. Так, проект «KAT5/KAT8 inhibitors» демонстрирует продуманный подход к поиску противоопухолевых молекул, а «FloraChem» представляет собой показательный пример работы с природными соединениями. Проект «Противовирусные молекулы» — это амбициозная попытка создать генератор новых соединений, а «ChitoMed» развивает актуальное направление по моделированию систем доставки лекарств. Каждый из этих проектов уже выходит за рамки учебного эксперимента и представляет собой сильный задел для дальнейшей научной работы. Некоторые из проектов имеют потенциал для публикации в научных журналах, а в перспективе и для коммерциализации. Но главное достижение, на мой взгляд, заключается в том, что участники стажировки обрели не только необходимые навыки, но и устойчивую мотивацию для продолжения исследований. Именно это и можно считать главным итогом нашей стажировки», — говорит Александр Бузаев.
Как отметили эксперты AIRI, студенты попробовали большинство современных ИТ-подходов для решения основных задач поиска малых молекул под известный целевой белок. Для серъёзного развития этих проектов теперь требуется поддержка реальной химико-биологической лаборатории для синтеза и испытания предложенных соединений.
«В целом стажировка прошла очень успешно. ТГУ предоставил отличную ИТ-инфраструктуру, помещения, поддержку местных преподавателей и дополнительные курсы для углубленного изучения материала. Мы остались очень впечатлены взаимодействием с этим сибирским вузом», — резюмировал руководитель Центра ИИ-разработки новых лекарственных препаратов AIRI Артур Кадурин.