Найти тему
Росатом Дзен

«Страна Росатом». «Компьютер будет буквально окружать нас»: о новой эпохе обмена информацией

В конце фильма «Бегущий человек» мятежники взрывают центры управления данными, перехватывают сфабрикованный видеопоток и запускают в эфир реальную картинку. По сюжету тот мир поделен на кластеры, связанные высокоскоростной сетью. Сегодня такие высокоскоростные сети уже не фантастика. Член-корреспондент РАН Руслан Смелянский рассказывает, как компьютерные технологии ведут человечество в новую эпоху обмена информацией.

— Работа, которую мы выполняли в рамках научной программы Национального центра физики и математики (НЦФМ) по направлению «Национальный центр исследования архитектур суперкомпьютеров», посвящена системе управления потоками заданий. Мы искали оптимальные решения распределения задач по системе, которая состоит из нескольких высокопроизводительных вычислителей, тесно взаимосвязанных высокоскоростными каналами.

Основная идея заключалась в применении так называемой мультиагентной оптимизации. Мультиагентная оптимизация — ​направление искусственного интеллекта, технологии которого позволяют в каждую точку системы управления встраивать агент. Он собирает и анализирует информацию о своих действиях и действиях соседей. На основе выводов агента строится целевая функция, соответствующая критериям оптимизации, и принимается решение по оптимизации работы системы управления потоками заданий. После этого оппонент, или критик, оценивает решение агента. Если оппонент считает, что решение было направлено в сторону оптимальности, то, соответственно, он выдает награду целевой функции агента, повышает ее значимость, и тогда целевая функция растет. Если оппонент считает, что решение не показало достаточной эффективности, уводило от оптимального, работа агента штрафуется, значение целевой функции понижается.

Для машинного обучения мы использовали класс алгоритмов, который называется reinforcement learning — ​обучение с подкреплением. Они требуют начального импульса, после которого постоянно доучиваются и сами себя совершенствуют. Общий процесс мультиагентной оптимизации следующий: алгоритм решает задачи, агент дает обратную связь, на основании этого оппонент делает вывод, и с каждым разом алгоритм совершает меньше ошибок.
Полный материал читайте в «Стране Росатом».
https://clck.ru/37rqnB