48,9 тыс подписчиков

Пионеры обучения с подкреплением получили премию Тьюринга

Эндрю Дж. Барто и Ричард С. Саттон получили премию Тьюринга 2024 года за развитие обучения с подкреплением. Это метод, при котором искусственный интеллект обучается с помощью вознаграждений и наказаний. ПО постепенно учится находить лучшие решения, совершая ошибки и получая обратную связь от окружающей среды. Учёные начали исследования в этой сфере ещё в 1980-е годы и разработали ключевые алгоритмы, которые до сих пор применяются в индустрии ИИ.

https://hightech.plus/2025/03/06/pioneri-obucheniya-s-podkrepleniem-poluchili-premiyu-tyuringa

Пионеры обучения с подкреплением получили премию Тьюринга Эндрю Дж. Барто и Ричард С. Саттон получили премию Тьюринга 2024 года за развитие обучения с подкреплением.

Около минуты

6 марта 2025