DeepMind заявила о начале новой эры ИИ — обучение из опыта заменит человеческие данные

8 мая 20258 мая 2025

2 мин

DeepMind заявила о начале новой эры ИИ — обучение из опыта заменит человеческие данные Дэвид Сильвер и Ричард Саттон из DeepMind опубликовали исследование, которое может перевернуть представление о развитии ИИ. Они утверждают, что эпоха обучения на человеческих данных заканчивается, и начинается эра автономного обучения агентов. Почему человеческие данные больше не работают? Крупнейшие языковые модели уже потребили практически все качественные данные, созданные человечеством. Чтобы двигаться дальше, ИИ нужно научиться создавать новое знание, а не копировать существующее. По словам авторов, системы достигли потолка в имитации человеческих способностей и не могут подняться выше определенного уровня. Что такое "эра опыта"? Представьте ИИ, который учится как младенец — не из учебников, а взаимодействуя с миром. Такие агенты будут: Жить в непрерывных потоках опыта, а не отвечать на разовые запросы Получать обратную связь прямо от реальности, а не от человеческих оценщиков Развивать соб

Дэвид Сильвер и Ричард Саттон из DeepMind опубликовали исследование, которое может перевернуть представление о развитии ИИ. Они утверждают, что эпоха обучения на человеческих данных заканчивается, и начинается эра автономного обучения агентов.

Почему человеческие данные больше не работают?

Крупнейшие языковые модели уже потребили практически все качественные данные, созданные человечеством. Чтобы двигаться дальше, ИИ нужно научиться создавать новое знание, а не копировать существующее. По словам авторов, системы достигли потолка в имитации человеческих способностей и не могут подняться выше определенного уровня.

Что такое "эра опыта"?

Представьте ИИ, который учится как младенец — не из учебников, а взаимодействуя с миром. Такие агенты будут:

Жить в непрерывных потоках опыта, а не отвечать на разовые запросы

Получать обратную связь прямо от реальности, а не от человеческих оценщиков

Развивать собственные способы мышления, не копируя человеческие шаблоны

Доказательства работают уже сейчас

AlphaProof — система, которая научилась решать олимпиадные задачи по математике. Она начала с 100 тысяч человеческих доказательств и самостоятельно сгенерировала 100 миллионов новых. Результат? Первая ИИ-система, получившая медаль на Международной математической олимпиаде.

Как это изменит мир?

Наука: ИИ будет самостоятельно планировать и проводить эксперименты, открывая новые материалы и лекарства

Персональные ассистенты: системы, которые адаптируются под ваши потребности месяцами и годами, а не забывают после каждого диалога

Новые профессии: возможно, появятся специальности по созданию и контролю таких автономных агентов

Темная сторона прогресса

Автономные агенты, действующие в реальном мире без постоянного контроля человека, создают новые риски. Когда ИИ разработает собственные способы мышления, будет ли человек способен контролировать его решения?

Авторы отмечают парадокс: обучение на опыте может быть и опаснее, и безопаснее одновременно. С одной стороны, агент сможет адаптироваться к меняющимся условиям и корректировать ошибки. С другой — предсказать его поведение станет сложнее.

Итог: Революция или эволюция?

По мнению авторов, технологии для этого перехода уже существуют. Вопрос не в том, произойдет ли эта революция, а в том, как быстро и с какими последствиями.

Интересно, что еще пять лет назад многие считали, что ИИ будет развиваться исключительно через улучшение человеческих примеров.

Сегодня DeepMind утверждает, что будущее — за автономным обучением.

А вы готовы доверить ИИ самостоятельное обучение или человек должен сохранить полный контроль над процессом?

Ссылка на статью.