33 подписчика

xAI vs OpenAI: Imagine v0.9 против Sora 2 — кто выигрывает гонку за генерацию видео?

8 октября 20258 окт 2025

3 мин

В начале октября 2025 года разгорелась очередная дуэль между компаниями Илона Маска и Сэма Альтмана. xAI представила новую версию своего видеогенератора Imagine v0.9 и открыла её бесплатно всем пользователям. Это явный ответ на недельной давности релиз OpenAI — Sora 2. По скорости Imagine обещает генерацию видео менее чем за 20 секунд, но при этом возникают заметные проблемы с точностью понимания текста, синхронизацией звука и визуала, а также с поддержкой китайского и других языков. В проекте xAI впервые участвует бывший старший инженер NVIDIA Хэ Ихуэй (Ethan He). Что нового в Imagine v0.9 Сравнение качества: где Imagine уступает Тесты журналистов показывают, что Imagine v0.9: Помимо этого, веб-версия Imagine на момент тестов работала нестабильно — мобильная версия работала лучше, но и там были сбои соединения. Громкая функция — кастомные голоса и риски Imagine v0.9 позволяет загружать фото и генерировать видео с голосом, приближённым к голосу публичных людей. Редактор провёл эксперим

По скорости Imagine обещает генерацию видео менее чем за 20 секунд, но при этом возникают заметные проблемы с точностью понимания текста, синхронизацией звука и визуала, а также с поддержкой китайского и других языков. В проекте xAI впервые участвует бывший старший инженер NVIDIA Хэ Ихуэй (Ethan He).

Что нового в Imagine v0.9

Скорость: xAI утверждает, что Imagine v0.9 генерирует видео за <20 секунд (Sora 2 — порядка 1–2 минут).
Доступность: Imagine v0.9 открыт бесплатно для всех; Sora 2 по-прежнему работает по инвайтам.
Длительность роликов: Imagine — около 6 секунд; Sora 2 поддерживает до 15 секунд.
Функции: интеграция в Grok, генерация «киношных» роликов прямо из текста или по загруженному изображению, нативное объединение аудио + видео, управление движением, динамическая камера (фокус/размытие) и возможность добавлять естественные диалоги или выразительное пение.
Технологические кадры: за проектом в xAI стоит команда, куда в июле перешёл из NVIDIA Этан Хэ — ранее участвовавший в разработке базовой модели Cosmos.

Сравнение качества: где Imagine уступает

Тесты журналистов показывают, что Imagine v0.9:

Часто неправильно интерпретирует подсказки (prompt).
Звук и изображение иногда не синхронизируются: персонажи могут выглядеть как кричащие, но в аудиодорожке этого нет.
При генерации трюков/движений возникают нереалистичные нарушения физики (например, бесконтрольное вращение в воздухе).
Не даёт предупреждений о риске дипфейка при использовании голосов публичных личностей.
Ограничена поддержка языков: модель «плохо» понимает и генерирует по-китайски.

Помимо этого, веб-версия Imagine на момент тестов работала нестабильно — мобильная версия работала лучше, но и там были сбои соединения.

Громкая функция — кастомные голоса и риски

Imagine v0.9 позволяет загружать фото и генерировать видео с голосом, приближённым к голосу публичных людей. Редактор провёл эксперимент: загрузив фото Илона Маска и фразу, команда получила разборчивую, но не идеальную копию голоса, при этом модель не предупреждала о рисках дипфейка. Такая функциональность увеличивает удобство и выразительность, но одновременно повышает угрозы злоупотреблений — создание фейковых роликов с публичными фигурами становится проще.

Итог и взгляд в будущее

За одну неделю OpenAI и xAI сделали существенные шаги в области генерации видео. OpenAI делает ставку на реализм, контролируемость и более длинные ролики, xAI — на скорость, массовую доступность и интерактивность (голосовой интерфейс в Grok). Оба подхода имеют свои сильные стороны и свои уязвимости: Sora 2 пока выглядит более аккуратно в понимании текста и синхронизации, Imagine v0.9 — быстрее и доступнее, но менее точен.

Ключевой вопрос для индустрии остаётся прежним: как найти баланс между инновациями и защитой от вредоносного использования? Возможность быстро и бесплатно генерировать короткие «киношные» клипы с кастомным голосом требует серьёзных технических, нормативных и этических механизмов защиты — от водяных знаков и метаданных до обязательных предупреждений о дипфейках и ограничений на использование голосов публичных лиц.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/