Найти тему

В 20 РАЗ БЫСТРЕЕ: В РОССИИ СОЗДАЛИ АЛГОРИТМ, ПОВЫШАЮЩИЙ СКОРОСТЬ ОБУЧЕНИЯ ИИ-МОДЕЛЕЙ


Применение новой технологии на практике позволит создавать максимально «умных» роботов для решения самых разнообразных задач

За стенами лаборатории исследований искусственного интеллекта Tinkoff Research сообщили о создании алгоритма, который позволит повысить скорость обучения ИИ-моделей в 20 раз. Стоит отметить, что лаборатория является одной из немногих исследовательских групп, которая проводит свои научные изыскания не в составе некоммерческой организации, а внутри финансовой компании. Результаты работы были представлены в конце июля на 40-й Международной конференции по машинному обучению (ICML). Она состоялась на Гавайах.

Метод получил название SAC-RND — Soft Actor Critic (мягкий актор-критик), RND — Random Network Distillation (случайные нейронные сети). Его тестировали на роботехнических симуляторах. В итоге удалось установить, что SAC-RND получает необходимый результат в 20 раз быстрее, нежели существующие методологии. При этом, как уверяют его разработчики, он потребляет намного меньше ресурсов, а качество получаемого результата выше на 10%.

Принцип действия SAC-RND построен на двух нейронных сетях: первая — случайная, вторая — основная. Во время работы основная пытается предсказать поведение случайной. Авторы проекта сообщают, что огромную роль здесь играет глубина нейросети, то есть количество слоёв, из которых она состоит. У основной этот показатель должен быть меньше, иначе она просто не сможет смоделировать поведение случайной.

Результат работы в Tinkoff Research удалось получить путём анализа предыдущих исследований. Метод RND использовал четыре слоя в случайной нейронной сети и два — в основной. По этой причине, как считают учёные, он не может классифицировать данные, то есть отличать действия в датасете от тех, которых там просто-напросто не было. Увеличение количества слоёв изменило ситуацию.

Дополнительным преимуществом SAC- RND стала дополнительная обработка сигналов. За счёт их слияния, в основе которого — модуляция сигналов и их линейное отображение, робототехника, участвующая в тестировании, научилась максимально быстро принимать правильные решения.

Новый метод должен повысить безопасность беспилотных транспортных средств, а также увеличить скорость работы роботизированных логистических центров. Также учёные заявили, что SAC-RDN позволит повысить качество работы узкоспециализированных роботов и приблизит тот день, когда будет создан универсальный робот.

2 минуты