Найти в Дзене
4pda.to

OpenAI Sora 2 против Grok Imagine: сравниваем популярные видеогенераторы на примерах

ИИ-сервисы для генерации роликов быстро развиваются. На днях дебютировала Sora 2 от создателей ChatGPT, а стартап Илона Маска xAI обновил свой бесплатный аналог — Grok Imagine. Смотрим на результаты конкурентов и их различия. Sora 2 считается передовым инструментом для фотореалистичных материалов со сложной физикой, диалогами и звуковыми эффектами. В свежей версии прокачали взаимодействие объектов и добавили интересную фишку под названием «камео». Можно отсканировать своё лицо и голос, чтобы создавать видео с собой в качестве персонажа. Доступ к Sora 2 пока ограничен: сервис предлагается по инвайтам (они есть в соцсетях вроде Discord и X) и доступен в виде iOS-приложения для IP-адресов США и Канады. Grok Imagine от xAI — более массовый продукт. Он доступен всем пользователям через веб-интерфейс Grok и мобильные клиенты (в РФ официально не работает). Нейронка формирует видеоряд по тексту и картинкам, умеет добавлять речь (в том числе на русском языке), музыку и прочие звуки. Главные отл
Оглавление
   OpenAI Sora 2 против Grok Imagine: сравниваем популярные видеогенераторы на примерах
OpenAI Sora 2 против Grok Imagine: сравниваем популярные видеогенераторы на примерах

ИИ-сервисы для генерации роликов быстро развиваются. На днях дебютировала Sora 2 от создателей ChatGPT, а стартап Илона Маска xAI обновил свой бесплатный аналог — Grok Imagine. Смотрим на результаты конкурентов и их различия.

-2

Функции и доступность

Sora 2 считается передовым инструментом для фотореалистичных материалов со сложной физикой, диалогами и звуковыми эффектами. В свежей версии прокачали взаимодействие объектов и добавили интересную фишку под названием «камео». Можно отсканировать своё лицо и голос, чтобы создавать видео с собой в качестве персонажа. Доступ к Sora 2 пока ограничен: сервис предлагается по инвайтам (они есть в соцсетях вроде Discord и X) и доступен в виде iOS-приложения для IP-адресов США и Канады.

Grok Imagine от xAI — более массовый продукт. Он доступен всем пользователям через веб-интерфейс Grok и мобильные клиенты (в РФ официально не работает). Нейронка формирует видеоряд по тексту и картинкам, умеет добавлять речь (в том числе на русском языке), музыку и прочие звуки. Главные отличия от Sora — высокая скорость генерации (15-20 секунд против 3-5 минут) и наличие «пикантного» режима Spicy. Однако длительность роликов ограничена 6 секундами.

Примеры

Журналисты Tom’s Guide сравнили клипы с обоих сервисов по одинаковым запросам. Все видеорезультаты приводятся в оригинальном материале. Вот основные наблюдения тестировщиков:

  • Кот в свитере. Запрос: «Драматичный кадр с нижнего ракурса: полосатый кот в толстом оливковом свитере пьёт кофе из винтажной медной кружки на деревенской скамейке в парке под пологом яркой красно-жёлтой листвы». Grok Imagine придал сцене сюрреалистичный и забавный вид, поскольку кота алгоритмы очеловечили. Sora 2, в свою очередь, сделала ставку на реализм, показав, как настоящий кот мог бы взаимодействовать с кружкой, с естественным для животного лизанием и правдоподобной текстурой шерсти. Победитель: Grok Imagine. Нейросеть лучше справилась с передачей причудливого творческого замысла.
  • Городская меланхолия. Запрос: «Медленный проезд камеры по залитой дождём ночной улице, где неоновые отражения колышутся в лужах, а одинокий мужчина под прозрачным зонтом ждёт под мерцающим фонарём». Sora 2 в точности отобразила сцену, где мужчина стоит под фонарём. Grok Imagine ошибся в ключевой детали: его персонаж шёл по улице, а не ждал, причём его движения были скованными и роботизированными. Победитель: Sora 2. За более точное следование промпту и реалистичность.
  • Природа в движении. Запрос: «Колибри зависает в воздухе над ярко-оранжевым цветком, быстро махая крыльями в золотом утреннем свете, в то время как капли росы падают в замедленной съёмке». Здесь Sora 2 показала впечатляющий результат, создав почти фотореалистичное видео, напоминающее кадры из документального фильма о природе. Grok Imagine, напротив, сделал акцент на стилизации: его капли росы выглядели как стеклянные шарики, а физика движения была неправдоподобной. Победитель: Sora 2. За мощный визуальный ряд и внимание к деталям.
  • Научная фантастика. Запрос: «Футуристичный поезд мчится по заснеженному городу в сумерках, отражения голографических рекламных щитов пляшут на его окнах». Обе нейросети показали отличный результат. Grok Imagine создал кинематографичную сцену с вихрями снега и светящимися огнями. Однако Sora 2 сделала шаг вперёд, проработав детали с невероятной точностью: отражения на окнах поезда были безупречными, а мягкий саундтрек добавлял атмосферы. Победитель: Sora 2 (с минимальным отрывом).

В целом качество Grok Imagine пока явно уступает Sora 2, но кое-где вариант от xAI проявляет более творческий подход.

-3

Нюансы с копирайтом

Сразу после релиза Sora 2 пользователи начали массово генерировать ролики с персонажами Disney, Marvel и других голливудских студий. OpenAI изначально заняла позицию невмешательства, предложив правообладателям самим обращаться с просьбами об удалении. Однако публичное заявление Motion Picture Association, которая пригрозила многомиллионными исками, заставило компанию передумать.

Ожидается, что скоро ужесточат правила насчёт контента, защищённого авторским правом, хотя фильтры всё равно «не будут работать идеально», заявил Сэм Альтман.