31 подписчик

Игра как тренажёр для роботов: как NVIDIA учит ИИ «по стримам» и почему GPT 5.2 рвёт «Зельду»

26 декабря 202526 дек 2025

3 мин

Расскажем про два связанных тренда: NitroGen: ИИ, который учится играть, просто глядя стримы NVIDIA представила модель NitroGen, которая: Итог: Аналогия с человеком: если вы прошли Elden Ring, то, попав в новый экшен, почти сразу понимаете, где бег, где удар, где уклон — даже без обучения. GPT‑5.2 и «Зельда»: ИИ планирует на 6 ходов вперёд Параллельно The Decoder протестировал топ‑модели на сложной головоломке из The Legend of Zelda: Результаты: Вывод авторов: такие модели уже умеют: В связке с NitroGen это даёт схему: Игровые миры как «Матрица» для обучения роботов Классический парадокс: модель, проходящая юрэкзамен, не может надёжно положить чашку в посудомойку (парадокс Моравека); Игры дают: NVIDIA строит вокруг этого: Формула, которую предлагает статья: «В игре учимся управлять,

в симуляции — физике,

в реальном мире — адаптации». Ограничения и вопросы Даже при впечатляющих успехах остаются серьёзные проблемы: Но общий тренд ясен:

игры перестают быть лишь «тестом для ИИ» и становят

в симуляции — физике,

игры перестают быть лишь «тестом для ИИ» и становят

Расскажем про два связанных тренда:

универсальный игровой агент от NVIDIA, который учится играть только по стримам;
новые ИИ вроде GPT‑5.2, уже решающие сложные игровые головоломки лучше людей — и всё это как задел для будущих «телесных» роботов.

NitroGen: ИИ, который учится играть, просто глядя стримы

NVIDIA представила модель NitroGen, которая:

не читает код игры и не «подключается к памяти»;
учится так же, как человек:
смотрит видеопоток (картинку игры) + оверлей геймпада в углу (какая кнопка нажата);
проглотила 40 000 часов стримов с YouTube/Twitch, где видно и игру, и виртуальный контроллер;
на этой базе сформировала универсальное «игровое чутьё».

Итог:

модель тренировали на 1000+ разных игр (RPG, платформеры, roguelike и т.п.);
при запуске в новой игре, которую она раньше не видела, NitroGen играет на 52% лучше, чем модели, обученные с нуля;
она не «заточена» под одну игру, а скорее перенимает общую логику:
как перемещаться, уворачиваться, атаковать, использовать интерфейс.

Аналогия с человеком: если вы прошли Elden Ring, то, попав в новый экшен, почти сразу понимаете, где бег, где удар, где уклон — даже без обучения.

GPT‑5.2 и «Зельда»: ИИ планирует на 6 ходов вперёд

Параллельно The Decoder протестировал топ‑модели на сложной головоломке из The Legend of Zelda:

есть сетка красно‑синих шаров;
при нажатии шар меняет цвет сам и у соседей по кресту;
цель — за несколько нажатий сделать все шары синими;
нужна дальняя перспектива (6+ шагов) и чёткое планирование, а не жадный ход «здесь и сейчас».

Результаты:

GPT‑5.2‑Thinking решает быстро и точно, демонстрируя сильное многозвенное планирование;
Gemini 3 Pro тоже справляется, но часто уходит в долгие, путаные цепочки проб и ошибок (ответы до 42 страниц);
Claude Opus 4.5 временами спотыкается уже на визуальном понимании, опираясь на формулы.

Вывод авторов: такие модели уже умеют:

внутренне «прокручивать» дерево состояний;
планировать, как в шахматах, но на визуальных, динамичных задачах.

В связке с NitroGen это даёт схему:

GPT‑5.2‑уровень — «мозг», который решает что делать и в какой последовательности;
NitroGen‑подобный модуль — «моторика», который понимает, как превратить план в конкретные нажатия.

Игровые миры как «Матрица» для обучения роботов

Классический парадокс: модель, проходящая юрэкзамен, не может надёжно положить чашку в посудомойку (парадокс Моравека);

не хватает:
данных с точной разметкой действий в мире,
навыка обобщать за пределами узкого сценария.

Игры дают:

богатую визуальную среду + физику + цели;
чёткий цикл «вижу → решаю → действую» — такой же, как у робота;
массовость: тысячи игр, миллионы часов видео.

NVIDIA строит вокруг этого:

GR00T — базовую модель для роботов;
NitroGen как средний уровень «двигательной интуиции», натренированный в играх;
«верхний уровень» — мощные модели типа GPT‑5.2 для сложного планирования;
«нижний» — контроллеры, которые уже управляют моторами, балансом и т.п.

Формула, которую предлагает статья:

«В игре учимся управлять,
в симуляции — физике,
в реальном мире — адаптации».

Ограничения и вопросы

Даже при впечатляющих успехах остаются серьёзные проблемы:

нет осязания: в играх не почувствуешь вес, трение, хрупкость;
точность движений: перейти от прыжков в платформере к миллиметровым сборочным операциям сложно;
безопасность и цели: робот с сильным планированием может «не так» интерпретировать задачу («быстрее помыть посуду» ≠ «разбить тарелки»).

Но общий тренд ясен:
игры перестают быть лишь «тестом для ИИ» и становятся массовым тренировочным полигоном для будущих универсальных агентов — сначала в виртуальном мире, потом в симуляции, затем в нашем.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/