Друзья, а вы слышали про модели искусственного интеллекта, которые могут создавать реалистичные и творческие сцены из текстовых инструкций? Речь идет о AI Sora, разработанной OpenAI и предназначенной для преобразования письменных промтов в яркие и динамичные видеоролики длительностью до 60 секунд. Название Sora, которое в переводе с японского означает "небо", символизирует безграничный творческий потенциал модели. Sora использует передовую технологию диффузионного трансформера для создания видеороликов. Модель работает, разбивая процесс создания видео на меньшие трехмерные блоки, аналогичные токенам в языковых моделях, и постепенно генерируя контент для каждого блока. Этот процесс позволяет создавать детализированные, визуально последовательные видео, отображающие широкий спектр сцен, от реалистичных окружающих сред до фантастических анимаций. Модель также использует технику повторного описания, чтобы улучшить точность создаваемых видео, автоматически добавляя подробные описания к под