обучение с подкреплением машинное обучение

2 года назад

За пределами контролируемого обучения: Обучение с подкреплением для автономных систем

Что такое обучение с подкреплением? Обучение с подкреплением (reinforcement learning) - это метод машинного обучения, в котором агент должен научиться принимать оптимальные решения в заданной среде, чтобы максимизировать получаемую награду. Агент получает обратную связь (награду или штраф) за каждое принятое им действие и использует эту информацию для обновления своей стратегии. В отличие от обучения с учителем, где данные имеют явные метки, в обучении с подкреплением агент учится на примерах опыта, полученных в процессе взаимодействия со средой...