31,6 тыс подписчиков

OpenAI представила нейросеть для генерации видео из текста

1 минута

8 прочтений

16 февраля

OpenAI, известная своими проектами ChatGPT и Dall-e, анонсировала свою новую разработку — нейросеть Sora.

Эта технология способна создавать реалистичные видеоролики на основе текстовых запросов пользователей, открывая новые горизонты в создании визуального контента.

Sora дает возможность генерировать видео продолжительностью до 60 секунд, обеспечивая высокое качество изображения и точное следование указаниям пользователя. Основная цель проекта — обучение искусственного интеллекта пониманию и имитации физического мира в движении.

Sora успешно справляется с разнообразными запросами, включая как реалистичные сцены с людьми и животными, так и фантастические сценарии, например, мамонты, бродящие по снежному полю, или киты, плывущие в воздухе среди зданий.

На данный момент доступ к модели предоставлен экспертам по информационной безопасности для оценки потенциальных угроз, а также художникам и дизайнерам для получения обратной связи и усовершенствования модели.

OpenAI акцентирует внимание на вопросах безопасности и этики при использовании Sora. Компания разрабатывает инструменты для выявления фейкового контента, включая классификатор для определения видео, созданных при помощи искусственного интеллекта.

Технически модель Sora представляет собой комбинацию GPT и диффузионной модели для генерации видео. Этот подход позволяет сохранять последовательность изображения объектов, даже если они временно выходят из поля зрения «камеры».

OpenAI планирует использовать метаданные C2PA для улучшения прозрачности происхождения контента в случае интеграции модели Sora в свои продукты. Технический доклад по проекту Sora обещают опубликовать в ближайшем времени.