Найти тему
Николай Лазарев

Применение ML в материаловедении (обзорная статья)

Это просто красивая картинка. Но в лабораториях МИСиС и Сколтеха оборудование  действительно серьезное).
Это просто красивая картинка. Но в лабораториях МИСиС и Сколтеха оборудование действительно серьезное).

Тематика применения машинного обучения (ML-machine learning) в материаловедении меня интересует по нескольким причинам.

В 2014 году я получил диплом инженера в НИТУ МИСиС по специальности 15.06.01 "Новые материалы и технологии". А сейчас, работая в крупной электротехнической компании в качестве аналитика-датасаентиста, применяю машинное обучение для решения аналитических задач бизнеса.

Анализируя информацию о последних достижениях науки о материалах с радостью узнал о применении машинного обучения в современных исследованиях и прогнозировании/разработке новых материалов.

Вдохновившись этой тематикой решил написать обзорную статью. Сразу оговорюсь, что моя статья не описывает какие-то собственные проекты. Это обзор, с акцентами на другие источники, которые показались мне важными и интересными.

Безусловно, применение ML в исследованиях не является самоцелью. Для выбора инструментария мы должны в первую очередь отталкиваться от понимания поставленных задач.

Но в начале нужно понять какие вызовы стоят сейчас перед сферой материаловедения в стране и в мире. Из указанного выше выступления профессора Оганова зафиксировал следующие большие цели, актуальные проблемы в современном материаловедении:

  1. Материалы для экстремальных условий.
  • Термобарьерные покрытия (для авиадвигателей).
  • Короззионностойкие материалы, покрытия
  • Радиационностойкие материалы

2. Материалы для генерации транспортировки и хранения энергии

  • Термоэлектрические материалы
  • Фотовольтаика
  • Сверхпроводники
  • Материалы для сверхэлектроёмких суперконденсаторов и аккумуляторов.

3. Материалы с экстремальными свойствами

  • Сверхпрочные, сверхлегкие, сверхтугоплавкие и т.д.
  • Экстремальные оптические характеристики
  • Заданная каталитическая активность

4. Умные материалы - изменение свойств (форма, размер, электропроводность) при изменении внешних условий

Одна из ключевых задач - прогнозирование кристаллической структуры материала. Это позволит прогнозировать свойства материалов, а также оптимизировать процессы производства.

На сегодняшний день создана база данных для порядка 300 000 экспериментально найденных неорганических кристаллических структур, и 500 000 теоретически обоснованных кристаллических структур. Для части структур измерены физические свойства, изучены процессы синтеза и промышленные процессы.

База данных Materials Project <https://en.wikipedia.org/wiki/Materials_Project>

На сегодняшний день существуют два основных пути в компьютерном дизайне материалов:

  1. Прогнозирование кристаллической структуры и свойств (поиск структуры с наименьшей энергией) с помощью квантово-механических расчётов.
  2. Методы больших данных - обучение (ML - machine learning). В основе интерполяционные методы основанные на анализе статистических больших данных. Под большими данными понимается объём информации, который проблематично обработать вручную. Например, таблица в несколько миллионов строк.

С помощью ML решается задача прогнозирования кристаллических структур в тех случаях, где ещё нет теории. Применение ML может заменять квантово-механические расчёты. В частности спрогнозировать квантово-механическую энергию и действующие силы, решать уравнение молекулярной динамики, рассчитывать фазовые диаграммы. Нужно отметить, что методы ML менее точны, но менее трудозатратны, и относительно быстро выдают результат.

USPEX

Один из современных подходов в предсказании кристаллической структуры воплощен в методе USPEX, разработанный Артёмом Ромаевичем Огановым Главная — USPEX (uspex-team.org)

В данном методе используется так называемый "Эволюционный алгоритм", а также квантово-механические расчёты.

Достижения

С помощью расчётных методов удалось предсказать теоретически а в дальнейшем экспериментально подтвердить такие рекорды сверх-проводимости:

H3S Tc=203k при высоком давлении. Бинарные гидриды подошли близко к комнатной сверх-проводимости Супергидрид Тория ThH10 Tc = 159-160k, супергидрид Итрия YH10 Tc=224k, супергидрид лантана LaH10 Tc=250k

Рекорд лаборатории Артёма Оганова 253К при 170ГПа(La,Y)H10. - тройные гидриды, на них возлагается большая надежда.

Прогнозирование сочетания свойств

Часто требуются не крайние значения определенных свойств, а сочетание свойств.

Термоэлектрические материалы - преобразование энергии из тепла и наоборот. Применяются в приборах ночного видения, в самонаводящихся ракетах. Задача - предсказать лучший материал из всех возможных соединений.

Расчёты термоэлектрических свойств проводит программа AICON (Fan & Oganov) в т.ч. для расчёта теплопроводности кристаллических веществ.

Примеры применения машинного обучения ML в проектах materialscience

  1. Ускорение прогнозирования кристаллической структуры с помощью машинного обучения межатомным потенциалам с активным обучением. Предложенная методология позволяет автоматизировать построение модели межатомного взаимодействия с нуля, заменяя дорогостоящую теорию функционала плотности (DFT), обеспечивая ускорение на несколько порядков Источник https://journals.aps.org/prb/abstract/10.1103/PhysRevB.99.064114
  2. Поиск материалов с низкой теплопроводностью для теплозащитных покрытий. В работе применен метод эффективных гармоник и моделирование однородной неравновесной молекулярной динамики с возможностями машинного обучения для расчета теплопроводности потенциальных материалов при температурах до 1500 K. Результаты , полученные для La2Zr2O7, ZrSiO4 и BaZrO3 полностью согласуются с экспериментом при любых температурах. Источник https://journals.aps.org/prmaterials/abstract/10.1103/PhysRevMaterials.8.033601
  3. С помощью ML и квантовых расчётов удалось опровергнуть гипотезу превосходства "пентаалмаза" по твёрдости над алмазом.
  4. Подбор оптимальных материалов для литий-ионных батарей. Потенциальный поиск альтернатив занял бы годы кропотливых исследований и тестирования миллионов вариантов новых материалов. Однако команда проекта из Microsoft смогла решить эту задачу всего за несколько месяцев, опираясь на мощь ИИ. Им удалось разработать опытный образец батареи с содержанием лития на 70% меньше относительно ряда альтернатив. Источник https://habr.com/ru/companies/bothub/articles/786188/
  5. Оптимизация мультикристаллических материалов с помощью ML В исследовании предлагается быстрое и точное измерение кристаллографической ориентации с помощью оптической визуализации и машинного обучения. Сочетание эффективных описателей и системы обучения позволяет провести скрининг свойств материалов и создать базу данных для тестирования материалов-кандидатов. Способность машинного обучения обрабатывать огромные объемы сложных данных подходит для решения проблемы связи между множеством оптических характеристик и кристаллографической ориентацией, поскольку оптические характеристики могут быть недостаточно воспроизведены обычными методами подгонки. Источник https://habr.com/ru/companies/bothub/articles/790760/
  6. Машинное обучение при разработке материалов для аккумуляторов Методы машинного обучения на основе данных (ML) и глубокого обучения (DL) вместе с высокопроизводительными экспериментальными и вычислительными подходами недавно стали важными инструментами для проектирования и открытия аккумуляторных материалов. Проблема проектирования аккумулятора в подходе, основанном на данных, с использованием методов ML, по сути, решает сложную функцию, которая учитывает составы аккумуляторов в качестве входных данных и измерения производительности в качестве выходных данных. Источник Machine learning-inspired battery material innovation - Energy Advances (RSC Publishing) (turbopages.org)

В качестве вывода можно сделать заключение, что ML применяется для анализа большого количества (миллионов) всевозможных вариантов подбора материалов под конкретные задачи, а также для ускорения подбора материалов по сравнению с квантово-механическими расчётами. Такой подход позволяет достигать значимых результатов за более короткие сроки.

Также в качестве дополнительной информации публикую результаты моего общения с Chat_GPT по теме статьи. Понятно, что некоторые темы звучат банально, но тенденция прослеживается.

Значимые вызовы применения ML в материаловедении

В области материаловедения и машинного обучения существует несколько значимых вызовов и задач, которые требуют решения для дальнейшего прогресса и развития:

1. Прогнозирование свойств материалов: Понимание и прогнозирование физических, механических и химических свойств материалов на основе их структуры и состава остается сложной задачей, требующей разработки более точных моделей и алгоритмов машинного обучения.

2. Недостаток данных: Для эффективного применения методов машинного обучения в материаловедении необходимо большое количество данных о свойствах материалов, которые часто ограничены или недоступны из-за сложности экспериментов или коммерческих ограничений.

3. Интерпретация результатов: Понимание и интерпретация результатов моделей машинного обучения в контексте материаловедения часто представляет собой сложную задачу из-за их высокой размерности и комплексности.

4. Объективность и обобщение: Обеспечение объективности и обобщения моделей машинного обучения при анализе данных о материалах важно для того, чтобы результаты были применимы к различным условиям и областям применения.

5. Управление качеством и стандартизация: Разработка стандартов и методов управления качеством в процессах производства материалов, основанных на данных и алгоритмах машинного обучения, является ключевой задачей для обеспечения надежности и безопасности материалов.

6. Экологическая устойчивость: Создание новых экологически устойчивых материалов и процессов производства, которые могут снизить негативное воздействие на окружающую среду, требует интеграции машинного обучения для оптимизации процессов и предсказания экологических свойств материалов.

Решение этих вызовов и задач в области материаловедения и машинного обучения будет способствовать более эффективному развитию новых материалов и технологий.

Варианты тем исследований

Вот несколько актуальных тем для диссертаций в области материаловедения, связанных с применением машинного обучения и больших языковых моделей:

1. Прогнозирование свойств материалов: Использование методов машинного обучения для прогнозирования физических и механических свойств материалов на основе их состава, структуры и обработки.

2. Оптимизация процессов производства материалов: Разработка алгоритмов машинного обучения для оптимизации процессов синтеза, обработки и формирования материалов с учетом различных факторов, таких как стоимость, энергоэффективность и качество.

3. Анализ структуры и микроструктуры материалов: Применение методов обработки изображений и анализа данных для автоматизированного анализа структурных и микроструктурных характеристик материалов.

4. Проектирование новых материалов: Использование генеративных моделей и алгоритмов машинного обучения для создания новых материалов с определенными желаемыми свойствами.

5. Моделирование и симуляция поведения материалов: Разработка компьютерных моделей и алгоритмов машинного обучения для прогнозирования поведения материалов при различных условиях нагрузки, температуры и окружающей среды.

6. Интеллектуальные материалы и датчики: Исследование материалов с встроенной способностью к обнаружению и реакции на изменения окружающей среды с использованием методов машинного обучения.

7. Управление качеством и дефектоскопия: Разработка алгоритмов машинного обучения для обнаружения дефектов и контроля качества материалов в процессе их производства и эксплуатации.

8. Экологически устойчивые материалы и процессы: Использование машинного обучения для оценки и снижения воздействия производства материалов на окружающую среду и разработки новых экологически устойчивых материалов.