1785 подписчиков

ИИ в космологии: ускорение анализа и неожиданное ограничение

3 дня назад3 дня назад

2 мин

Космологи всё чаще обращаются к методам машинного обучения, чтобы анализировать колоссальные объёмы данных о Вселенной. Однако создание обучающих выборок для таких алгоритмов требует генерации миллионов детализированных симуляций виртуальных вселенных с разными физическими параметрами — процесс, который потребляет огромные вычислительные ресурсы и время. Исследователи нашли способ ускорить этот этап, используя подход, известный как трансферное обучение (transfer learning), но при этом столкнулись с неожиданным ограничением. Оказалось, что искусственный интеллект, обученный на стандартной космологической модели (ΛCDM), может с трудом распознавать действительно новые явления, если их наблюдаемые проявления слишком похожи на уже известные эффекты. Суть метода в том, чтобы сначала обучить нейронную сеть на относительно простых и дешёвых симуляциях в рамках стандартной модели ΛCDM (Lambda-Cold Dark Matter), где гравитация подчиняется общей теории относительности, тёмная энергия считается по

Исследователи нашли способ ускорить этот этап, используя подход, известный как трансферное обучение (transfer learning), но при этом столкнулись с неожиданным ограничением. Оказалось, что искусственный интеллект, обученный на стандартной космологической модели (ΛCDM), может с трудом распознавать действительно новые явления, если их наблюдаемые проявления слишком похожи на уже известные эффекты.

Суть метода в том, чтобы сначала обучить нейронную сеть на относительно простых и дешёвых симуляциях в рамках стандартной модели ΛCDM (Lambda-Cold Dark Matter), где гравитация подчиняется общей теории относительности, тёмная энергия считается постоянной величиной, а нейтрино — безмассовыми. Этот этап даёт алгоритму базовое понимание того, как устроена Вселенная и как формируются крупномасштабные структуры. Затем полученные знания переносятся на более сложные модели, включающие возможную новую физику: массивные нейтрино, модифицированную гравитацию или эволюционирующую тёмную энергию. Такой подход сокращает количество необходимых дорогостоящих симуляций более чем в десять раз, поскольку ИИ не приходится начинать с нуля.

Однако в некоторых случаях трансферное обучение приводит к негативному переносу. Проблема возникает, когда сигналы от новой физики внешне неотличимы от тех, что порождаются параметрами стандартной модели. Например, изменение массы нейтрино и изменение параметра σ8, который описывает степень кластеризации материи, могут давать почти идентичные наблюдательные сигнатуры. Нейронная сеть, привыкшая интерпретировать такие сигналы в рамках ΛCDM, ошибочно относит к ним и данные из альтернативных моделей, не замечая действительно новых явлений.

Исследование, опубликованное в Journal of Cosmology and Astroparticle Physics, выполнено на симуляциях, а не на реальных наблюдениях. Тем не менее, оно имеет прямое отношение к будущим космологическим проектам, которые будут генерировать беспрецедентные объёмы высокоточных данных. Авторы подчёркивают, что эффект негативного переноса не случаен — он заложен в самой физике, когда разные модели приводят к схожим наблюдательным проявлениям. Преодоление этой трудности потребует более тщательного проектирования обучающих выборок и, возможно, гибридных подходов, сочетающих машинное обучение с классическим статистическим выводом. Но сам факт, что ИИ способен радикально ускорить поиск новой физики, остаётся важным открытием.

Астрономия

10,9 тыс интересуются