Найти в Дзене
ЮФУ | SFEDU

Нейросеть и рентгеновские спектры: ученые ЮФУ совместно с коллегами из Yandex Cloud нашли способ ускорить анализ катализаторов

Рассказываем, как проект Центра технологий для общества Yandex Cloud и Южного федерального университета помогает учёным исследовать атомную структуру катализаторов.

Что такое катализаторы и для чего они нужны

В Международном исследовательском институте интеллектуальных материалов Южного федерального университета (МИИИМ ЮФУ) разрабатывают новые методы диагностики катализаторов.

Катализаторы — это вещества, которые ускоряют химические реакции и при этом не расходуются сами. Почти у каждого промышленного процесса есть свой катализатор — например, катализатор Филлипса для синтеза полиэтилена, катализатор Циглера-Натта для производства полипропилена, родиевые катализаторы для получения спиртов в гидроформилировании и платиновые — для водородной энергетики.

Несмотря на огромную роль катализаторов в современной технической цивилизации, долгое время о процессах, которые с ними происходят на атомарном уровне, было известно крайне мало. Чтобы понять, как устроены активные центры катализаторов, почему они деградируют и как улучшить их активность, учёные используют спектроскопию рентгеновского поглощения — один из самых точных неразрушающих методов диагностики атомной структуры.

Эксперименты проводят на синхротронах — установках мегакласса, позволяющих буквально «заглянуть» внутрь вещества в процессе его работы, например при высоких температурах и давлении газов.

Одна из экспериментальных станций Курчатовского источника синхротронного излучения. Здесь исследуют катализаторы в условиях, максимально приближённых к реальным.
Одна из экспериментальных станций Курчатовского источника синхротронного излучения. Здесь исследуют катализаторы в условиях, максимально приближённых к реальным.
Схема подобного эксперимента: в капилляре под давлением и при нагреве формируются активные центры родия. Их спектры фиксируют с помощью рентгеновского излучения, а затем математически обрабатывают для дальнейшей расшифровки структуры
Схема подобного эксперимента: в капилляре под давлением и при нагреве формируются активные центры родия. Их спектры фиксируют с помощью рентгеновского излучения, а затем математически обрабатывают для дальнейшей расшифровки структуры

Интерпретировать полученные спектры — задача сложная. Даже при наличии инструкции и верного направления анализ может занять несколько часов. От момента измерения до публикации результатов может пройти год, даже при участии профильных специалистов из квантовой химии, спектроскопии и компьютерного моделирования.

Какое решение реализовали

Чтобы упростить и ускорить анализ спектров, междисциплинарный коллектив МИИИМ ЮФУ, а именно Богдан Проценко, Михаил Лифарь, Георгий Асатуров, Даниил Куприяненко, Назар Чубков, Кирилл Кулаев, Георгий Кочиев, Александр Гуда, Сергей Гуда, под руководством профессора, научного руководителя направления ЮФУ Александра Солдатова, разработала интеллектуального агента-исследователя. Он создан на основе большой языковой модели и обучен на специально собранных базах данных с помощью авторского фреймворка PyFitIt.

Архитектура решения не зависит от конкретной LLM, агент может работать с разными моделями. Для научных задач хорошо подходят нейросети с большим числом параметров, например LLaMa 3.2 (40B)[*принадлежит компании Meta, которая признана экстремистской и запрещена в РФ] и DeepSeek R1: они обеспечивают более высокую точность логических рассуждений и позволяют формировать обоснованные и осмысленные выводы.

-4

Общение с агентом происходит через телеграм-бот. Пользователь загружает документ со спектром — обычный текстовый файл с данными. Система подхватывает его и запускает анализ: формирует код, разворачивает Docker®-контейнер и выполняет расчёты на фреймворке для спектроскопии. В ответ пользователь получает результат, основанный на физических и химических закономерностях: заряд атомов, расстояния между ними и координационные числа.

Телеграм-бот поддерживает два сценария взаимодействия:

Пайплайн-режим — линейная работа с подсказками, подходящая для начинающих пользователей.

Свободный режим — пользователь задаёт промт в свободной форме, и агент сам подбирает подход к анализу.


Схема работы пользователей с интеллектуальным агентом в свободном режиме
Схема работы пользователей с интеллектуальным агентом в свободном режиме

На всё — от запроса до ответа — уходит меньше минуты. Точность анализа при этом не только сопоставима с результатами, полученными вручную, — во многих случаях она даже выше. Особенно это заметно в сценариях, где не используются заранее подготовленные шаблоны или примеры. При этом вероятность ошибки не превышает 10%.

Почему выбрали облако

У ЮФУ есть собственный вычислительный кластер, основанный на CPU. Расширение инфраструктуры для работы с большими языковыми моделями на базе GPU потребовало бы значительных вложений. Поэтому обучение и развёртывание LLM команда реализовала в облаке — на базе Yandex Cloudпри помощи Yandex DataSphere. В сервисе есть все необходимые инструменты и динамически масштабируемые облачные ресурсы для полного цикла разработки машинного обучения.

Какие результаты уже получили и что в планах

Разработанный агент позволил автоматизировать анализ спектров и сократить время обработки данных — с нескольких месяцев до одной минуты. Погрешность в предсказании ключевых значений не превышает:

● 0,2 ед. — по заряду атомов (степень окисления, отражающая, сколько электронов отдал атом металла в активном центре);

● 0,3 ед. — по координационным числам (количество ближайших атомов-соседей);

● 0,01 Å — по расстояниям между атомами (средняя дистанция от центрального атома до окружающих).

В совокупности эти показатели позволяют исследователю-химику понять структуру и поведение активного центра катализатора, а также признаки его деградации.

Команда планирует распространить и адаптировать агента для использования на крупных российских установках — в том числе на Курчатовском синхротроне в рамках проекта по разработке умной станции operando-диагностики. Цель — создать удобный и надёжный инструмент, который станет «золотым стандартом» обработки данных для пользователей таких платформ. Разработка инструментов спектрального анализа ведетсяпри поддержке программы «Приоритет-2030» ЮФУ.