Найти в Дзене

PixVerse запустил Realtime R1.

известный по инструментам генерации коротких клипов, открыл доступ к новой модели R1 через интерфейс realtime.pixverse.ai. Вместо привычного «введи промпт, подожди минуту, получи ролик» сервис предлагает режим live: картинка меняется буквально между кадрами, пока пользователь редактирует описание, перемещает ползунки или просто говорит голосом. Разработчики называют это «бесконечной видеогенерацией», потому что поток никогда не прерывается: система просто подстраивает следующие кадры под новые условия, сохраняя персонажей, освещение и физику сцены. Как работает R1: https://realtime.pixverse.ai Архитектура построена на диффузионном трансформере с примесью рекуррентных слоёв. Ключевая деталь: модель хранит скрытое состояние мира в 128-битных токенах, которые обновляются каждые 40 мс. Это позволяет не перегенерировать всё полотно заново, а «докрашивать» только то, что изменилось. Если зритель попросил убрать стол из комнаты, R1 не взрывает кадр белым шумом, а плавно стирает предмет, подтя

Стартап PixVerse,

известный по инструментам генерации коротких клипов, открыл доступ к новой модели R1 через интерфейс realtime.pixverse.ai. Вместо привычного «введи промпт, подожди минуту, получи ролик» сервис предлагает режим live: картинка меняется буквально между кадрами, пока пользователь редактирует описание, перемещает ползунки или просто говорит голосом. Разработчики называют это «бесконечной видеогенерацией», потому что поток никогда не прерывается: система просто подстраивает следующие кадры под новые условия, сохраняя персонажей, освещение и физику сцены.

Как работает R1: https://realtime.pixverse.ai

Архитектура построена на диффузионном трансформере с примесью рекуррентных слоёв. Ключевая деталь: модель хранит скрытое состояние мира в 128-битных токенах, которые обновляются каждые 40 мс. Это позволяет не перегенерировать всё полотно заново, а «докрашивать» только то, что изменилось. Если зритель попросил убрать стол из комнаты, R1 не взрывает кадр белым шумом, а плавно стирает предмет, подтягивая за собой тени и отражения. Память о мире живёт 32 секунды, чего достаточно, чтобы удержать в голове расположение мебели, одежду героя и даже направление ветра в парке.

Интерфейс будущего;

На странице realtime.pixverse.ai нет кнопки «render». Есть только текстовое поле и трансляция. Набираешь «sunset cyberpunk alley, neon signs in Japanese» и сразу видишь, как тёмная улочка начинает расцвечиваться. Хочешь добавить дождь? Дописываешь «heavy rain, wet asphalt reflects lights». Через полсекунды капли бьют по камере, а в лужах появляется игра бликов. Никаких прелоадеров и часов ожидания. Система выдаёт 24 кадра в секунду при разрешении 1280 на 720, а платные пользователи получают 1920 на 1080 и 30 fps.

Сцена не ломается, если ввести противоречие. Попросите «убрать солнце» в середине летнего ролика: R1 плавно переведёт день в вечер, перекрасит небо и подкрутит цвет кожи персонажей, чтобы всё выглядело естественно. Такое пов поведению напоминает редактирование слоёв в Photoshop, только в движении.

Где пригодится;

Тиктокеры уже используют R1 для стримов «живые обои»: зрители пишут в чате, что хотят видеть за спиной блогера, и фон мгновенно меняется от космодрома до джунглей. Геймдизайнеры пробуют делать превизуализации уровней: художник буквально рассказывает сцену вслух, и клип готов к показу команде. Образовательные стартапы тестируют интерактивные уроки истории: ученик говорит «покажи Париж 1889», камера зумирует на Эйфелеву башню, затем «пусть идёт снег», и метель накрывает площадь без потери деталей.

Ограничения, которые быстро уменьшаются;

Пока R1 не умеет генерировать звук, но PixVerse обещает аудиотрансформер в июле. Длительность одной сессии ограничена пятью минутами из-за нагрузки на серверы, однако компания готовит локальную версию для Mac и Windows с урезанной, но всё же впечатляющей скоростью. Пока модель знает только английский и китайский, но поддержка русского, испанского и японского запланирована на август.

Цены и доступ;

Бесплатный тариф даёт 20 минут realtime-генерации в месяц и водяной знак. За 19 долларов в месяц убирают логотип, повышают разрешение и увеличивают лимит до 8 часов. Корпоративный план за 199 долларов добавляет API, чтобы встраивать R1 в собственные приложения. Уже сегодня стартапы заказывают интеграцию для виртуальных витрин и онлайн-шоурумов: покупатель может сказать «хочу диван в винтажном стиле» и тут же увидеть, как мебель появляется в 3D-комнате, меняя ткань и цвет по голосу.