Команда Google DeepMind анонсировала третье поколение своей ИИ-модели для создания виртуальных миров — Genie 3. Нейросеть способной генерировать интерактивные 3D-среды в реальном времени.
В отличие от предыдущей версии, Genie 3 запоминает элементы в сцене, даже если пользователь на время отворачивается, и поддерживает длительное взаимодействие без визуальных искажений. Это довольно важный шаг в развитии генеративных моделей, предназначенных для создания цифровых миров для гейминга, обучения или имитации поведения ИИ-агентов.
Новая модель может поддерживать несколько минут непрерывного взаимодействия. Это существенный прогресс по сравнению с 10-20 секундами в Genie 2. Вместе с этим разрешение генерации достигло 720p при 24 кадрах в секунду, а визуальная память удерживается до минуты. Благодаря функции «подсказок к событиям», пользователи могут не только задавать начальные условия мира, но и динамически менять, например, погоду или добавлять персонажей. Всё это работает в режиме, нап