103 читали · 9 месяцев назад
Невероятный прорыв от OpenAI. Sora, нейросеть, которая умеет делать реалистичное видео по текстовому описанию.
Перевод статьи от исследовательского центра OpenAI Модели генерации видео как симуляторы мира Мы исследуем масштабное обучение генеративных моделей на видеоданных. В частности, мы совместно обучаем модели условного распространения текста на видео и изображениях различной продолжительности, разрешения и соотношения сторон. Мы используем архитектуру преобразователя, которая работает с пространственно-временными фрагментами скрытых кодов видео и изображений. Наша самая крупная модель Sora способна генерировать минутное видео высокого качества...