Добавить в корзинуПозвонить
Найти в Дзене
fizmatik

Genie 3 — это не «ещё одна нейросеть от Google», а первый реально массовый шаг к симулятору мира по тексту.

О чем вообще Genie 3 Genie 3 — модель мира, которая по одной фразе генерирует интерактивный мир, в котором можно ходить, прыгать, сталкиваться с объектами и менять окружение на лету.
Это не видео и не скриншот: кадры считаются авто-регрессионно в реальном времени — примерно 24 FPS на 720p, с физикой и памятью сцены. Обычные LLM и визуалки: ты пишешь промпт — получаешь текст, картинку или ролик, но дальше это мертвая штука.
Genie 3 — это симулятор, который предсказывает следующий кадр и состояние мира, учитывая прошлые действия и контекст среды. Ключевые фишки: Картинка: схематичный график «LLM = текст, Diffusion = картинка/видео, Genie 3 = интерактивный мир». Genie 1 и 2 умели генерить короткие, довольно хрупкие среды — больше как научные демки для RL-агентов. Память ломалась через 10–20 секунд: сцена начинала «плыть», объекты прыгали по позициям, консистентность умирала. Что поменялось в Genie 3: Сейчас Genie 3 упакован в Project Genie — экспериментальный прототип, доступный через G
Оглавление
project genie
project genie

О чем вообще Genie 3

Genie 3 — модель мира, которая по одной фразе генерирует интерактивный мир, в котором можно ходить, прыгать, сталкиваться с объектами и менять окружение на лету.
Это не видео и не скриншот: кадры считаются авто-регрессионно в реальном времени — примерно 24 FPS на 720p, с физикой и памятью сцены.

и это не просто картинка или видео, а полноценный мир где можно передвигаться!!!
и это не просто картинка или видео, а полноценный мир где можно передвигаться!!!
-3

Чем это принципиально отличается от LLM и «обычного» генератива

Обычные LLM и визуалки: ты пишешь промпт — получаешь текст, картинку или ролик, но дальше это мертвая штука.
Genie 3 — это симулятор, который предсказывает следующий кадр и состояние мира, учитывая прошлые действия и контекст среды.

Ключевые фишки:

  • Реальное время: новый кадр за ~41 мс, тянет живой интерактив.
  • Эмерджентная физика: гравитация, движение, взаимодействия не вручную заданы, а «выросли» из обучения на видео и данных.
  • Память мира: сцена держится стабильной несколько минут — вернулся в точку, и окружение «вспомнено», а не выдумано заново.

Картинка: схематичный график «LLM = текст, Diffusion = картинка/видео, Genie 3 = интерактивный мир».

Эволюция: от Genie 1/2 к Genie 3

Genie 1 и 2 умели генерить короткие, довольно хрупкие среды — больше как научные демки для RL-агентов.

genie 2
genie 2

Память ломалась через 10–20 секунд: сцена начинала «плыть», объекты прыгали по позициям, консистентность умирала.

Что поменялось в Genie 3:

  • Реально играбельные миры, не просто «видео с управлением».
  • Полная мультимодальность: текст, картинки, видео в обучении и управлении.​
  • Упор на стабильность сцены и физики на протяжении минут, а не секунд.
  • Оптимизация под более низкий compute при более высоком качестве, в отличие от тяжёлого, но слабого по отдаче Genie 2.​
genie 3!!!
genie 3!!!

Project Genie: как это дали людям в руки

Сейчас Genie 3 упакован в Project Genie — экспериментальный прототип, доступный через Google AI Ultra (то есть не всем и не вечно бесплатно).
Интерфейс без магии: текстовый промпт, выбор стиля / жанра, дальше — сразу интерактивный мир, где ты либо сам управляешь, либо ставишь агента.

💀💀💀
💀💀💀

Ключевые возможности в руках пользователя:

  • Создавать миры по тексту, дорабатывать их новыми промптами на лету (сменить погоду, добавить объекты, поменять правила).
  • Строить персонажей и задавать им поведение, фактически превращая Genie в конструктор мини-игр.
  • Использовать как среду для обучения агентов и прототипирования: от роботов до бизнес-процессов.

Что в итоге

  • Это первый массовый кейс world model, который чувствуется как «игра из текста», а не как научная статья.
  • Если ты геймдев или студент, Genie 3 — это Unity на стероидах: прототипы механик, уровней, симуляций за часы вместо недель.
  • Для ИИ-агентов это решает проблему среды: можно накатывать миллионы эпизодов в синтетических мирах, не ломая голову над ручной сборкой окружения.

Что пока слабое и с подвохом:

  • Качество мира сильно зависит от формулировки и длины сессии: чем дольше играешь, тем больше шанс «глюков» и деградации сцены.
  • Контент- и безопасностные ограничения: публичный доступ — через фильтры и лимиты, это не «генерация чего угодно».
  • Это не движок AAA-игры: скорее генератор прототипов, песочниц и симуляторов, чем конкурент полноценному продакшн-гейму.


Мир уже симулируется. 💀