Представьте себе: вы печатаете всего пару строк — «древний лес на закате, с мерцающими огоньками в густой листве» — и внезапно оказываетесь внутри этого мира: мягкий ветер колышет ветви, свет пробивается сквозь листву, а внизу тихо журчит ручей. Это не игра, созданная вручную за месяцы, и уж точно не картинка — это Genie 3, новейшая «модель-мира» от Google DeepMind, которая буквально оживляет ваши описания.
Genie 3 – это огромный скачок по сравнению с прошлым поколением. Как сообщает DeepMind, теперь во-первых, создаваемые миры работают в разрешении 720p при 24 кадрах в секунду, и взаимодействие с ними происходит в реальном времени — прямо как в играх.
Во-вторых, миры теперь «помнят» — то есть обладают визуальной памятью. Если вы отвернётесь от предмета, а потом снова на него глянете, он всё ещё будет на том же месте, и надпись на стене не исчезнет. Genie 3 сохраняет стабильность сцены несколько минут, а не секунд, как это было в Genie 2 (10–20 секунд максимум).
В-третьих, эти миры динамичны: вы можете изменять погоду, добавлять персонажей или объекты, и они отреагируют — всё это можно делать с помощью текстовых команд в ходе взаимодействия.
А теперь представьте несколько примеров для наглядности:
1. Фантазийный лес с динамикой — вы задаёте: «грибной лес с сияющими света́ми, дождём и необъяснимыми тенями». Genie 3 создаёт такой мир: капли дождя капают по капле, светлячки танцуют вокруг, и вдалеке вы увидите странные силуэты, словно из сна. Вернётесь туда через минуту — всё на месте, с тем же освещением и движением.
2. Урбанистический пазл — «покинутый заводской комплекс с машинами, керосиновыми фонарями и туманом». Вы гуляете среди металлических стен, ветром разносится запах масла, туман плотный — и тут вы командуете: «Добавь падающий лист, дождь, шум мотора». Genie 3 мгновенно адаптирует мир: лист опускается, капли моросит, а издалека слышен двигатель — и всё держится.
3. Робот-тренировка — в виртуальном складе генерируется реалистичное пространство, где робот-агент отрабатывает движение коробки. Genie 3 позволяет добавить препятствия, изменить освещение, а агент учится ориентироваться. Все изменения сохраняются, а комната становится настоящей лабораторией виртуальной робототехники.
Почему это важно?
Genie 3 — это не просто эффектная демонстрация. По словам DeepMind, такие world models — ключ к развитию искусственного общего интеллекта (AGI). Они позволяют агентам учиться в богатых, разнообразных средах без ручного создания уровней. Это огромный шаг в области робототехники, обучения ИИ и виртуальной симуляции.
Но не всё идеально:
- Пока ещё ограниченная продолжительность. Мир остаётся стабильным «несколько минут», а дальше память слабее.
- Интерфейс взаимодействия пока примитивен — например, агенты могут только перемещаться, сложные сценарии, многоперсонажные взаимодействия, сложные действия пока не поддерживаются.
- Отсутствие географической точности — Genie 3 генерирует уникальные миры, а не точно копирует реальные места.
- Доступ ограничен — модель находится в закрытой исследовательской превью-версии и пока доступна лишь избранным учёным и разработчикам.
Заключение
Genie 3 — это настоящий портал в будущее виртуальных миров: фантазийные леса, промышленные лабиринты, обучающие полигоны для роботов — всё это появляется по вашему описанию и остаётся живым. Это не просто красивое видео, это живой трёхмерный мир, который реагирует и запоминает. Genie 3 — это прорыв в технологиях, шаг навстречу новым возможностям творчества, образования и исследования, и, возможно, один из фундаментальных кирпичиков AGI.
Будем с интересом следить, что будет дальше — Genie 3, а затем и Genie 4?