Найти тему
6019 подписчиков

#ии


Российские учёные заявили, что создали самый эффективный в мире алгоритм для обучения ИИ: вчетверо быстрее аналогов

Новый метод, названный ReBRAC (Revisited Behavior Regularized Actor Critic — пересмотренный актор-критик с контролируемым поведением), обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям на ходу

Суть открытия в том, что ученые из Tinkoff Research идентифицировали четыре компонента, которые были представлены в алгоритмах последних лет, но считались второстепенными и не подвергались детальному анализу:

▪️Глубина нейронных сетей. Увеличение глубины сети помогает ей лучше понимать сложные закономерности в данных

▪️Регуляризация актора и критика. В ИИ-агентах есть два компонента: «актор», который предпринимает действия, и «критик», который оценивает эти действия. Ученые использовали совместную регуляризацию обоих компонентов, чтобы актор избегал нежелательных действий, а критик более эффективно оценивал их. Ранее не было понятно, как сочетать оба подхода с наибольшей эффективностью

▪️Увеличение эффективного горизонта планирования — позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи и улучшает ее способность принимать решения

▪️Использование нормализации слоев (LayerNorm) — стабилизирует процесс обучения нейронных сетей

Эти компоненты интегрировали в алгоритм-предшественник BRAC (Behavior Regularized Actor Critic — актор-критик с контролируемым поведением) 2019 года и провели исследование, поочередно варьируя каждый из них

Оказалось, что правильная совокупность этих компонентов дает даже этому старому подходу самую высокую производительность среди лучших аналогов на сегодняшний день

@imaxai Подписаться
#ии  Российские учёные заявили, что создали самый эффективный в мире алгоритм для обучения ИИ: вчетверо быстрее аналогов  Новый метод, названный ReBRAC (Revisited Behavior Regularized Actor Critic —
1 минута