В DeepMind вывели своих виртуальных агентов на новый уровень, представив SIMA 2 — расширенную версию SIMA (Scalable Instructable Multiworld Agent). Если первая модель умела уверенно выполнять более шести сотен базовых навыков вроде «повернуть налево» или «открыть карту», то её преемник работает заметно глубже. Агент не просто движется по инструкции, а оценивает ситуацию, выстраивает цепочку действий и объясняет, почему делает тот или иной шаг. В основе архитектуры — Gemini, который отвечает за восприятие, понимание и принятие решений. Благодаря этому SIMA 2 поддерживает общение в нескольких форматах: текст, голос и даже изображения. Это заметно расширяет способы взаимодействия — от простых подсказок до полноценного диалога о том, что происходит на экране. Одним из основных прорывов стала способность агента связывать похожие задачи в разных играх. Если он научился «добывать ресурс» в одном мире, то может применить похожую логику для «сбора урожая» в совершенно иной среде. Более того, SI
SIMA 2 от Google DeepMind: ИИ, который понимает игры и учится в виртуальных мирах
13 ноября 202513 ноя 2025
2
3 мин