Найти в Дзене
Social Mebia Systems

Игра как тренажёр для роботов: как NVIDIA учит ИИ «по стримам» и почему GPT 5.2 рвёт «Зельду»

Расскажем про два связанных тренда: NitroGen: ИИ, который учится играть, просто глядя стримы NVIDIA представила модель NitroGen, которая: Итог: Аналогия с человеком: если вы прошли Elden Ring, то, попав в новый экшен, почти сразу понимаете, где бег, где удар, где уклон — даже без обучения. GPT‑5.2 и «Зельда»: ИИ планирует на 6 ходов вперёд Параллельно The Decoder протестировал топ‑модели на сложной головоломке из The Legend of Zelda: Результаты: Вывод авторов: такие модели уже умеют: В связке с NitroGen это даёт схему: Игровые миры как «Матрица» для обучения роботов Классический парадокс: модель, проходящая юрэкзамен, не может надёжно положить чашку в посудомойку (парадокс Моравека); Игры дают: NVIDIA строит вокруг этого: Формула, которую предлагает статья: «В игре учимся управлять,
в симуляции — физике,
в реальном мире — адаптации». Ограничения и вопросы Даже при впечатляющих успехах остаются серьёзные проблемы: Но общий тренд ясен:
игры перестают быть лишь «тестом для ИИ» и становят

Расскажем про два связанных тренда:

  1. универсальный игровой агент от NVIDIA, который учится играть только по стримам;
  2. новые ИИ вроде GPT‑5.2, уже решающие сложные игровые головоломки лучше людей — и всё это как задел для будущих «телесных» роботов.

NitroGen: ИИ, который учится играть, просто глядя стримы

NVIDIA представила модель NitroGen, которая:

  • не читает код игры и не «подключается к памяти»;
  • учится так же, как человек:
    смотрит видеопоток (картинку игры) + оверлей геймпада в углу (какая кнопка нажата);
  • проглотила 40 000 часов стримов с YouTube/Twitch, где видно и игру, и виртуальный контроллер;
  • на этой базе сформировала универсальное «игровое чутьё».

Итог:

  • модель тренировали на 1000+ разных игр (RPG, платформеры, roguelike и т.п.);
  • при запуске в новой игре, которую она раньше не видела, NitroGen играет на 52% лучше, чем модели, обученные с нуля;
  • она не «заточена» под одну игру, а скорее перенимает общую логику:
    как перемещаться, уворачиваться, атаковать, использовать интерфейс.

Аналогия с человеком: если вы прошли Elden Ring, то, попав в новый экшен, почти сразу понимаете, где бег, где удар, где уклон — даже без обучения.

GPT‑5.2 и «Зельда»: ИИ планирует на 6 ходов вперёд

Параллельно The Decoder протестировал топ‑модели на сложной головоломке из The Legend of Zelda:

  • есть сетка красно‑синих шаров;
  • при нажатии шар меняет цвет сам и у соседей по кресту;
  • цель — за несколько нажатий сделать все шары синими;
  • нужна дальняя перспектива (6+ шагов) и чёткое планирование, а не жадный ход «здесь и сейчас».

Результаты:

  • GPT‑5.2‑Thinking решает быстро и точно, демонстрируя сильное многозвенное планирование;
  • Gemini 3 Pro тоже справляется, но часто уходит в долгие, путаные цепочки проб и ошибок (ответы до 42 страниц);
  • Claude Opus 4.5 временами спотыкается уже на визуальном понимании, опираясь на формулы.

Вывод авторов: такие модели уже умеют:

  • внутренне «прокручивать» дерево состояний;
  • планировать, как в шахматах, но на визуальных, динамичных задачах.

В связке с NitroGen это даёт схему:

  • GPT‑5.2‑уровень — «мозг», который решает что делать и в какой последовательности;
  • NitroGen‑подобный модуль — «моторика», который понимает, как превратить план в конкретные нажатия.

Игровые миры как «Матрица» для обучения роботов

Классический парадокс: модель, проходящая юрэкзамен, не может надёжно положить чашку в посудомойку (парадокс Моравека);

  • не хватает:
  • данных с точной разметкой действий в мире,
  • навыка обобщать за пределами узкого сценария.

Игры дают:

  • богатую визуальную среду + физику + цели;
  • чёткий цикл «вижу → решаю → действую» — такой же, как у робота;
  • массовость: тысячи игр, миллионы часов видео.

NVIDIA строит вокруг этого:

  • GR00T — базовую модель для роботов;
  • NitroGen как средний уровень «двигательной интуиции», натренированный в играх;
  • «верхний уровень» — мощные модели типа GPT‑5.2 для сложного планирования;
  • «нижний» — контроллеры, которые уже управляют моторами, балансом и т.п.

Формула, которую предлагает статья:

«В игре учимся управлять,
в симуляции — физике,
в реальном мире — адаптации».

Ограничения и вопросы

Даже при впечатляющих успехах остаются серьёзные проблемы:

  • нет осязания: в играх не почувствуешь вес, трение, хрупкость;
  • точность движений: перейти от прыжков в платформере к миллиметровым сборочным операциям сложно;
  • безопасность и цели: робот с сильным планированием может «не так» интерпретировать задачу («быстрее помыть посуду» ≠ «разбить тарелки»).

Но общий тренд ясен:
игры перестают быть лишь «тестом для ИИ» и становятся
массовым тренировочным полигоном для будущих универсальных агентов — сначала в виртуальном мире, потом в симуляции, затем в нашем.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/