405 подписчиков
Делимся с вами еще одной важной научной работой победителя Конкурса Фонда «Развитие химической физики».
Александр Ксенофонтов, к.х.н., с.н.с. лаборатории «Химия и молекулярная фотоника дипиррометеновых красителей и люминофоров» Института химии растворов им. Г.А. Крестова РАН, занял в конкурсе 3 место.
📖 Тема работы: Использование методов машинного обучения для предсказания спектральных свойств красителей различной природы.
Красители широко используются в различных областях: аналитической химии, биохимии, медицине и др. Для создания структур красителей, применимых в конкретной области, нужно точно определить их спектральные характеристики (длины волн поглощения, испускания и возбуждения, молярный коэффициент поглощения, квантовый выход и время жизни флуоресценции). После чего химик на основе своих знаний и химической интуиции синтезирует необходимое соединение. Компьютерные методы могут выступать в качестве более эффективных альтернативных подходов. Наиболее часто используемыми методами анализа и прогнозирования спектральных свойств красителей являются методы DFT и TDDFT, но они имеют высокие требования к вычислительным ресурсам. По сравнению с методами квантовой химии методы ML не требуют вычислительных и временных ресурсов, а точность полученных прогнозов сопоставима или превосходит классический in silico эксперимент.
🤖 В работе отражены результаты создания моделей на основе метода машинного обучения CatBoost/ECFP для точного предсказания длины волны максимума поглощения и молярного коэффициента поглощения для красителей различной природы.
🔬 Модели обучены на более 20 000 записей по прогнозируемым параметрам для красителей разных классов и протестированы на соединениях, синтезированных в лаборатории. Анализ метрик моделей (5-CV) показывает, что RMSE для длины волны максимума поглощения составляет 18 нм, а для молярного коэффициента поглощения 0.26 лог.ед.
✅ Модели общедоступны и расположены на сайте
1 минута
13 июня 2024