Компания OpenAI представила революционную нейронную сеть Sora, способную создавать целые видеоролики на основе текстовых описаний, что стало еще одной вехой в развитии способностей искусственного интеллекта. Sora, характеризующаяся как диффузионная модель, способна генерировать сложные сцены со множеством персонажей, нюансами движений и креативными деталями объектов и фона. Как сообщается на сайте проекта, модель демонстрирует понимание контекстуальных сигналов и знания о поведении различных объектов в физическом мире.
Примечательным аспектом функциональности Sora является ее способность мгновенно генерировать целые видеоролики, обходя традиционный покадровый подход. Эта функция позволяет решить проблему, с которой ранее сталкивались другие подобные ИИ, когда объекты могли меняться при повороте или переходе камеры. Пока Sora находится в стадии разработки, OpenAI воздерживается от ее широкого распространения, ссылаясь на опасения по поводу безопасности. Компания активно изучает стратегии, направленные на уменьшение распространения оскорбительного контента и четкое разграничение видео, созданных искусственным интеллектом.
Тем не менее OpenAI предоставила доступ к Sora избранной группе художников, дизайнеров и режиссеров для обратной связи, чтобы оптимизировать полезность модели для творческих начинаний. Кроме того, следует отметить, что объявление о дебюте Sora на сайте OpenAI появилось недавно, и многие видео еще не доступны на других платформах.