Компания OpenAI представила новую диффузионную генеративную модель машинного обучения под названием Sora, которая способна создавать по текстовому описанию видео высокого качества с малым количеством артефактов, разрешением до 1920×1080 и продолжительностью до одной минуты. Помимо этого, Sora может дополнять новыми кадрами уже существующие видеофрагменты, а также создавать новые и анимировать уже существующие статичные изображения. Генерация видеоконтента по текстовому описанию (text-to-video) — возникшее сравнительно недавно стремительно развивающееся направление машинного обучения, которое стало логическим продолжением исследований в области генерации изображений. Существенный прогресс в этом направлении начался в течение последних двух лет. Несмотря на определенные успехи, качество генерации до последнего времени оставалось довольно низким. 15 февраля 2024 года компания OpenAI представила собственную text-to-video модель под названием Sora. Это диффузионная генеративная модель, кото
Sora: новая нейросеть для генерации видео по текстовому описанию
19 февраля 202419 фев 2024
7
2 мин