Разработан эффективный «оптимистичный» алгоритм для обучения с подкреплением

Результат был представлен на конференции ICML-2022.Naked Science
Обучение с подкреплением — один из видов машинного обучения.Naked Science
Вопрос выбора между исследованием среды и использованием уже имеющихся знаний — один из главных для построения эффективных алгоритмов обучения с подкреплением.Naked Science
Алгоритм, представленный учеными, позволил преодолеть пропасть между теорией и практикой.Naked Science