Исследователи, работающие на Большом адронном коллайдере (БАК), нуждаются в симуляции огромного количества событий и обучении нейросетей, которые способны генерировать аномалии, чтобы впоследствии их идентифицировать в процессе реальных экспериментов. Андрей Устюжанин, заведующий лабораторией методов анализа больших данных в НИУ ВШЭ, рассказывает в интервью «Хайтек» как ML-алгоритмы помогают в исследованиях CERN.
«Аномалиями в данных, полученных на БАК, могут быть открытия, которые не укладываются в стандартные представления о том, как происходит распад частиц после столкновения протонов. Есть две группы алгоритмов, которые работают с аномалиями. В первой — алгоритмы, которые используют информацию только о тех событиях, которые помечены как "хорошие". Другая группа алгоритмов опирается на частичную разметку того, что мы считаем неправильным: есть набор событий, о которых точно известно, что это нежелательные результаты. И тогда поиск аномалий сводится к задаче двухклассовой классификации. Это обычный классификатор, который может быть построен на принципах нейронных сетей или деревьях решений».
«Одна большая задача, с которой мы работаем, заключается в ускорении вычислительных процессов, которые симулируют физические столкновения и распады частиц. Мы можем просимулировать физику при определенных внешних параметрах с высокой точностью и сказать, какими наблюдаемыми характеристиками будут описываться правильные сигнальные события — например, распад бозона Хиггса».
«Идея ускорения заключается в обучении нейросети на событиях, которые были сымитированы с помощью сертифицированного пакета — GMT 4, с помощью которого симулируется все, что происходит внутри детекторов коллайдера. Эта нейронка научится сопоставлять входы, параметры частиц, которые мы хотим просимулировать, и выходы — наблюдаемые характеристики, которые выдает детектор».
«У физиков в широком смысле машинное обучение сейчас востребовано, потому что предоставляет более точные инструменты по работе с данными. И в обратную сторону это работает, потому что специалистам по машинному обучению бывает гораздо интереснее смотреть, как их алгоритмы помогают в открытии новых частиц — например, как в нашей лабораторией. <...> Недавно писали и говорили об открытии новых тетракварков — наши алгоритмы приняли непосредственное участие в их открытии».