Специалисты DeepMind — принадлежащей Google лаборатории искусственного интеллекта — объявили о разработке новой нейросети Genie («Джинн»), способной генерировать игры по текстовым запросам пользователей. Пока что модель умеет создавать лишь двухмерные платформеры, но даже имеющийся результат весьма впечатляет.
Genie представляет собой относительно небольшую ИИ-модель с 11 миллиардами параметров. Её обучали на более чем 200 000 часах общедоступных видео, где люди играют в разные двухмерные платформеры. И хотя эти ролики не включали никаких подсказок касательно управления и необходимости нажатия тех или иных кнопок для выполнения определённых действий, нейросеть сумела во всём разобраться самостоятельно. Модель поняла принципы физики и взаимодействия персонажа с окружением.
В результате «Джинн» умеет создавать игры по текстовому описанию, схематическим наброскам или готовым изображениям, в том числе сгенерированным с помощью ИИ и даже реальным фотографиям. На выходе получается хоть и простенький, но всё же платформер, где игрок может полноценно управлять персонажем.
Поскольку нейросеть обучали на видео с разрешением лишь 160x90 пикселей и частотой 10 кадров в секунду, она генерирует игры с таким же разрешением. Кроме того, их длительность составляет всего 16 секунд, а частота кадров — 1 fps. Но главное, что сама концепция рабочая, а теперь осталось только совершенствовать её. Больше примеров работы Genie можно посмотреть на сайте проекта.