1 месяц назад
РЛ по жизни
За последний год я стал настоящим энтузиастом обучения с подкреплением (RL) и посвящал размышлениям об этих концепциях почти всё своё свободное время. Это не только обогатило мои знания в AI, но и неожиданно научило меня важным урокам о том, как строить жизнь, чтобы добиваться настоящего прогресса. Всё началось с того, что я погрузился в RL, и постепенно идеи вроде "on-policy" подхода, имитационного обучения и bootstrapping стали для меня не просто техническими терминами, а метафорами для личного роста. Я осознал, что в RL, как и в жизни, ключ к успеху — не в слепом копировании чужих путей, а в создании своих собственных траекторий...
1 месяц назад
Karpathy: конец эпохи «силового» RL и рождение новой парадигмы AI-обучения
В мире искусственного интеллекта долгое время доминировала идея, что именно reinforcement learning (RL, обучение с подкреплением) — ключ к созданию универсального искусственного разума (AGI). Однако Андрей Карпати, один из самых авторитетных AI-исследователей, в своей свежей публикации подверг сомнению этот подход и предложил альтернативу: эволюцию через «рефлексию и ревизию» — то есть обучение на собственных ошибках и осознанное извлечение уроков, как это делает человек. Почему RL не ведёт к AGI?...