Тематика применения машинного обучения (ML-machine learning) в материаловедении меня интересует по нескольким причинам.
В 2014 году я получил диплом инженера в НИТУ МИСиС по специальности 15.06.01 "Новые материалы и технологии". А сейчас, работая в крупной электротехнической компании в качестве аналитика-датасаентиста, применяю машинное обучение для решения аналитических задач бизнеса.
Анализируя информацию о последних достижениях науки о материалах с радостью узнал о применении машинного обучения в современных исследованиях и прогнозировании/разработке новых материалов.
Вдохновившись этой тематикой решил написать обзорную статью. Сразу оговорюсь, что моя статья не описывает какие-то собственные проекты. Это обзор, с акцентами на другие источники, которые показались мне важными и интересными.
Безусловно, применение ML в исследованиях не является самоцелью. Для выбора инструментария мы должны в первую очередь отталкиваться от понимания поставленных задач.
Но в начале нужно понять какие вызовы стоят сейчас перед сферой материаловедения в стране и в мире. Из указанного выше выступления профессора Оганова зафиксировал следующие большие цели, актуальные проблемы в современном материаловедении:
- Материалы для экстремальных условий.
- Термобарьерные покрытия (для авиадвигателей).
- Короззионностойкие материалы, покрытия
- Радиационностойкие материалы
2. Материалы для генерации транспортировки и хранения энергии
- Термоэлектрические материалы
- Фотовольтаика
- Сверхпроводники
- Материалы для сверхэлектроёмких суперконденсаторов и аккумуляторов.
3. Материалы с экстремальными свойствами
- Сверхпрочные, сверхлегкие, сверхтугоплавкие и т.д.
- Экстремальные оптические характеристики
- Заданная каталитическая активность
4. Умные материалы - изменение свойств (форма, размер, электропроводность) при изменении внешних условий
Одна из ключевых задач - прогнозирование кристаллической структуры материала. Это позволит прогнозировать свойства материалов, а также оптимизировать процессы производства.
На сегодняшний день создана база данных для порядка 300 000 экспериментально найденных неорганических кристаллических структур, и 500 000 теоретически обоснованных кристаллических структур. Для части структур измерены физические свойства, изучены процессы синтеза и промышленные процессы.
База данных Materials Project <https://en.wikipedia.org/wiki/Materials_Project>
На сегодняшний день существуют два основных пути в компьютерном дизайне материалов:
- Прогнозирование кристаллической структуры и свойств (поиск структуры с наименьшей энергией) с помощью квантово-механических расчётов.
- Методы больших данных - обучение (ML - machine learning). В основе интерполяционные методы основанные на анализе статистических больших данных. Под большими данными понимается объём информации, который проблематично обработать вручную. Например, таблица в несколько миллионов строк.
С помощью ML решается задача прогнозирования кристаллических структур в тех случаях, где ещё нет теории. Применение ML может заменять квантово-механические расчёты. В частности спрогнозировать квантово-механическую энергию и действующие силы, решать уравнение молекулярной динамики, рассчитывать фазовые диаграммы. Нужно отметить, что методы ML менее точны, но менее трудозатратны, и относительно быстро выдают результат.
USPEX
Один из современных подходов в предсказании кристаллической структуры воплощен в методе USPEX, разработанный Артёмом Ромаевичем Огановым Главная — USPEX (uspex-team.org)
В данном методе используется так называемый "Эволюционный алгоритм", а также квантово-механические расчёты.
Достижения
С помощью расчётных методов удалось предсказать теоретически а в дальнейшем экспериментально подтвердить такие рекорды сверх-проводимости:
H3S Tc=203k при высоком давлении. Бинарные гидриды подошли близко к комнатной сверх-проводимости Супергидрид Тория ThH10 Tc = 159-160k, супергидрид Итрия YH10 Tc=224k, супергидрид лантана LaH10 Tc=250k
Рекорд лаборатории Артёма Оганова 253К при 170ГПа(La,Y)H10. - тройные гидриды, на них возлагается большая надежда.
Прогнозирование сочетания свойств
Часто требуются не крайние значения определенных свойств, а сочетание свойств.
Термоэлектрические материалы - преобразование энергии из тепла и наоборот. Применяются в приборах ночного видения, в самонаводящихся ракетах. Задача - предсказать лучший материал из всех возможных соединений.
Расчёты термоэлектрических свойств проводит программа AICON (Fan & Oganov) в т.ч. для расчёта теплопроводности кристаллических веществ.
Примеры применения машинного обучения ML в проектах materialscience
- Ускорение прогнозирования кристаллической структуры с помощью машинного обучения межатомным потенциалам с активным обучением. Предложенная методология позволяет автоматизировать построение модели межатомного взаимодействия с нуля, заменяя дорогостоящую теорию функционала плотности (DFT), обеспечивая ускорение на несколько порядков Источник https://journals.aps.org/prb/abstract/10.1103/PhysRevB.99.064114
- Поиск материалов с низкой теплопроводностью для теплозащитных покрытий. В работе применен метод эффективных гармоник и моделирование однородной неравновесной молекулярной динамики с возможностями машинного обучения для расчета теплопроводности потенциальных материалов при температурах до 1500 K. Результаты , полученные для La2Zr2O7, ZrSiO4 и BaZrO3 полностью согласуются с экспериментом при любых температурах. Источник https://journals.aps.org/prmaterials/abstract/10.1103/PhysRevMaterials.8.033601
- С помощью ML и квантовых расчётов удалось опровергнуть гипотезу превосходства "пентаалмаза" по твёрдости над алмазом.
- Подбор оптимальных материалов для литий-ионных батарей. Потенциальный поиск альтернатив занял бы годы кропотливых исследований и тестирования миллионов вариантов новых материалов. Однако команда проекта из Microsoft смогла решить эту задачу всего за несколько месяцев, опираясь на мощь ИИ. Им удалось разработать опытный образец батареи с содержанием лития на 70% меньше относительно ряда альтернатив. Источник https://habr.com/ru/companies/bothub/articles/786188/
- Оптимизация мультикристаллических материалов с помощью ML В исследовании предлагается быстрое и точное измерение кристаллографической ориентации с помощью оптической визуализации и машинного обучения. Сочетание эффективных описателей и системы обучения позволяет провести скрининг свойств материалов и создать базу данных для тестирования материалов-кандидатов. Способность машинного обучения обрабатывать огромные объемы сложных данных подходит для решения проблемы связи между множеством оптических характеристик и кристаллографической ориентацией, поскольку оптические характеристики могут быть недостаточно воспроизведены обычными методами подгонки. Источник https://habr.com/ru/companies/bothub/articles/790760/
- Машинное обучение при разработке материалов для аккумуляторов Методы машинного обучения на основе данных (ML) и глубокого обучения (DL) вместе с высокопроизводительными экспериментальными и вычислительными подходами недавно стали важными инструментами для проектирования и открытия аккумуляторных материалов. Проблема проектирования аккумулятора в подходе, основанном на данных, с использованием методов ML, по сути, решает сложную функцию, которая учитывает составы аккумуляторов в качестве входных данных и измерения производительности в качестве выходных данных. Источник Machine learning-inspired battery material innovation - Energy Advances (RSC Publishing) (turbopages.org)
В качестве вывода можно сделать заключение, что ML применяется для анализа большого количества (миллионов) всевозможных вариантов подбора материалов под конкретные задачи, а также для ускорения подбора материалов по сравнению с квантово-механическими расчётами. Такой подход позволяет достигать значимых результатов за более короткие сроки.
Также в качестве дополнительной информации публикую результаты моего общения с Chat_GPT по теме статьи. Понятно, что некоторые темы звучат банально, но тенденция прослеживается.
Значимые вызовы применения ML в материаловедении
В области материаловедения и машинного обучения существует несколько значимых вызовов и задач, которые требуют решения для дальнейшего прогресса и развития:
1. Прогнозирование свойств материалов: Понимание и прогнозирование физических, механических и химических свойств материалов на основе их структуры и состава остается сложной задачей, требующей разработки более точных моделей и алгоритмов машинного обучения.
2. Недостаток данных: Для эффективного применения методов машинного обучения в материаловедении необходимо большое количество данных о свойствах материалов, которые часто ограничены или недоступны из-за сложности экспериментов или коммерческих ограничений.
3. Интерпретация результатов: Понимание и интерпретация результатов моделей машинного обучения в контексте материаловедения часто представляет собой сложную задачу из-за их высокой размерности и комплексности.
4. Объективность и обобщение: Обеспечение объективности и обобщения моделей машинного обучения при анализе данных о материалах важно для того, чтобы результаты были применимы к различным условиям и областям применения.
5. Управление качеством и стандартизация: Разработка стандартов и методов управления качеством в процессах производства материалов, основанных на данных и алгоритмах машинного обучения, является ключевой задачей для обеспечения надежности и безопасности материалов.
6. Экологическая устойчивость: Создание новых экологически устойчивых материалов и процессов производства, которые могут снизить негативное воздействие на окружающую среду, требует интеграции машинного обучения для оптимизации процессов и предсказания экологических свойств материалов.
Решение этих вызовов и задач в области материаловедения и машинного обучения будет способствовать более эффективному развитию новых материалов и технологий.
Варианты тем исследований
Вот несколько актуальных тем для диссертаций в области материаловедения, связанных с применением машинного обучения и больших языковых моделей:
1. Прогнозирование свойств материалов: Использование методов машинного обучения для прогнозирования физических и механических свойств материалов на основе их состава, структуры и обработки.
2. Оптимизация процессов производства материалов: Разработка алгоритмов машинного обучения для оптимизации процессов синтеза, обработки и формирования материалов с учетом различных факторов, таких как стоимость, энергоэффективность и качество.
3. Анализ структуры и микроструктуры материалов: Применение методов обработки изображений и анализа данных для автоматизированного анализа структурных и микроструктурных характеристик материалов.
4. Проектирование новых материалов: Использование генеративных моделей и алгоритмов машинного обучения для создания новых материалов с определенными желаемыми свойствами.
5. Моделирование и симуляция поведения материалов: Разработка компьютерных моделей и алгоритмов машинного обучения для прогнозирования поведения материалов при различных условиях нагрузки, температуры и окружающей среды.
6. Интеллектуальные материалы и датчики: Исследование материалов с встроенной способностью к обнаружению и реакции на изменения окружающей среды с использованием методов машинного обучения.
7. Управление качеством и дефектоскопия: Разработка алгоритмов машинного обучения для обнаружения дефектов и контроля качества материалов в процессе их производства и эксплуатации.
8. Экологически устойчивые материалы и процессы: Использование машинного обучения для оценки и снижения воздействия производства материалов на окружающую среду и разработки новых экологически устойчивых материалов.