Друзья, а вы слышали про модели искусственного интеллекта, которые могут создавать реалистичные и творческие сцены из текстовых инструкций? Речь идет о AI Sora, разработанной OpenAI и предназначенной для преобразования письменных промтов в яркие и динамичные видеоролики длительностью до 60 секунд. Название Sora, которое в переводе с японского означает "небо", символизирует безграничный творческий потенциал модели. Sora использует передовую технологию диффузионного трансформера для создания видеороликов. Модель работает, разбивая процесс создания видео на меньшие трехмерные блоки, аналогичные токенам в языковых моделях, и постепенно генерируя контент для каждого блока. Этот процесс позволяет создавать детализированные, визуально последовательные видео, отображающие широкий спектр сцен, от реалистичных окружающих сред до фантастических анимаций. Модель также использует технику повторного описания, чтобы улучшить точность создаваемых видео, автоматически добавляя подробные описания к подсказкам пользователя.
Потенциальные области применения Sora включают прототипирование фильмов и анимации, создание образовательного контента, видеоролики для социальных сетей, маркетинг и даже синтетическую генерацию данных для обучения AI-систем.
OpenAI предпринимает значительные шаги для обеспечения этичного и безопасного использования Sora. Это включает работу с экспертами для тестирования модели на предмет возможного злоупотребления, такого как создание вводящего в заблуждение или вредоносного
контента. Видеоролики, созданные Sora, будут содержать метаданные, указывающие на их AI-происхождение, что поможет предотвратить распространение дезинформации.
На данный момент Sora еще не доступна широкой публике, и OpenAI продолжает совершенствовать ее возможности и устранять недостатки перед более широким выпуском.
Вот здесь можно посмотреть больше видео созданных AI Sora.