О чем вообще Genie 3 Genie 3 — модель мира, которая по одной фразе генерирует интерактивный мир, в котором можно ходить, прыгать, сталкиваться с объектами и менять окружение на лету.
Это не видео и не скриншот: кадры считаются авто-регрессионно в реальном времени — примерно 24 FPS на 720p, с физикой и памятью сцены. Обычные LLM и визуалки: ты пишешь промпт — получаешь текст, картинку или ролик, но дальше это мертвая штука.
Genie 3 — это симулятор, который предсказывает следующий кадр и состояние мира, учитывая прошлые действия и контекст среды. Ключевые фишки: Картинка: схематичный график «LLM = текст, Diffusion = картинка/видео, Genie 3 = интерактивный мир». Genie 1 и 2 умели генерить короткие, довольно хрупкие среды — больше как научные демки для RL-агентов. Память ломалась через 10–20 секунд: сцена начинала «плыть», объекты прыгали по позициям, консистентность умирала. Что поменялось в Genie 3: Сейчас Genie 3 упакован в Project Genie — экспериментальный прототип, доступный через G