Найти в Дзене
Герман Геншин

Copilot создает играбельную версию Quake II

Microsoft демонстрирует свою новую модель WHAMM, которая позволяет играть в Quake II с генерацией контента в реальном времени. Вы можете попробовать эту AI-сгенерированную игру прямо в браузере, хотя на практике это в основном демонстрация возможностей — играть в нее не слишком увлекательно. Игры с генерацией контента в реальном времени могут как навредить, так и улучшить игровую индустрию, и мнения по этому поводу разнятся. Однако разработка генеративных игровых моделей стремительно набирает обороты. Исследователи нашли способ запускать Doom с помощью нейронной модели обучения Google GameNGen, OASIS AI предложила безумную генеративную версию Minecraft в браузере, а в феврале 2025 года Microsoft представила свою уникальную систему генеративных игр WHAM. Модель WHAM-1.6B, представленная Microsoft шесть недель назад, была впечатляющей, но неудобной в использовании. Она генерировала всего один кадр в секунду при разрешении 300 x 180, а для обучения "играбельной" игры требовалось семь лет

Microsoft демонстрирует свою новую модель WHAMM, которая позволяет играть в Quake II с генерацией контента в реальном времени. Вы можете попробовать эту AI-сгенерированную игру прямо в браузере, хотя на практике это в основном демонстрация возможностей — играть в нее не слишком увлекательно.

Игры с генерацией контента в реальном времени могут как навредить, так и улучшить игровую индустрию, и мнения по этому поводу разнятся. Однако разработка генеративных игровых моделей стремительно набирает обороты. Исследователи нашли способ запускать Doom с помощью нейронной модели обучения Google GameNGen, OASIS AI предложила безумную генеративную версию Minecraft в браузере, а в феврале 2025 года Microsoft представила свою уникальную систему генеративных игр WHAM.

Модель WHAM-1.6B, представленная Microsoft шесть недель назад, была впечатляющей, но неудобной в использовании. Она генерировала всего один кадр в секунду при разрешении 300 x 180, а для обучения "играбельной" игры требовалось семь лет данных. Microsoft сразу же начала работу над обновленной моделью WHAMM (World Human Action MaskGIT Model) после дебюта WHAM-1.6B, и результаты оказались довольно поразительными. WHAMM сейчас работает с разрешением видео 600 x 340 (в два раза больше, чем у WHAM-1.6B), выдает минимум 10 кадров в секунду и смогла воспроизвести Quake II всего с неделей данных для обучения.

-2

Эти успехи связаны с улучшенной архитектурой. Вместо типичной автогрессирующей системы, где AI генерирует один токен за раз, WHAMM использует подход MaskGIT, который позволяет "генерировать все токены для изображения за столько итераций, сколько нам требуется." Проще говоря, новая модель применяет параллельную обработку, что увеличивает скорость вывода, качество изображений и точность предсказаний.

Игры, созданные WHAMM, на практике не слишком интересны для игры. Они выглядят размыто и нечетко, частота кадров оставляет желать лучшего (хотя она не сильно отличается от того, что игроки испытывали в 1997 году), а противники в игре практически неразличимы. Демо периодически тормозит, хотя Microsoft объясняет "очевидную задержку" проблемами с веб-плеером, а не самой моделью.

WHAMM также сталкивается с проблемой "короткосрочной памяти", которую мы наблюдали в других генеративных игровых моделях. Поскольку WHAMM — это предсказательная модель, она генерирует новые кадры, основываясь на предыдущих, и плохо справляется с отслеживанием здоровья и патронов. Враги могут исчезать, как только вы отворачиваетесь от них (или появляться вдруг без причины), а ваш персонаж может неожиданно телепортироваться в другое место на карте, если упирается в стену или смотрит на пол.

Тем не менее, во время тестирования WHAMM показалась менее подверженной проблемам с "короткосрочной памятью", чем некоторые другие модели. Его длина контекста в 0.9 секунды вполне достаточна, чтобы избежать головокружительной и странной безумности, которую я испытывал при игре в генеративный Minecraft, хотя длина контекста все же является серьезной проблемой, которую Microsoft предстоит решить.

Следует отметить, что WHAMM была обучена только на первом уровне Quake II. Если вы подниметесь на лифте в конце уровня, модель зависает. Так что утверждение Microsoft о том, что WHAMM можно обучить за неделю видео, немного вводит в заблуждение — модель требует меньше данных для обучения, чем WHAM-1.6B, однако количество данных, необходимых для генерации интерактивной игры, будет варьироваться в зависимости от сложности игры и других факторов.

6 устройств, которые не могут запустить DOOM

Может быть, DOOM не так универсален, как казалось.

Что касается будущего применения этой технологии, Microsoft понимает, что AI в реальном времени может создавать "новые формы интерактивных медиа", но все еще ищет, каким именно должно быть это медиа.

Вы можете попробовать реальную генерацию Quake II на сайте Copilot Labs. Игры имеют ограниченное время и будут сбрасываться по истечении таймера. Напоминаем, что это всего лишь подтверждение возможностей, поэтому не стоит ожидать слишком многого.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Вы также можете найти наши материалы в:

Шутеры
4634 интересуются