В 2024 году на рынок вышли новые модели искусственного интеллекта, которые способны создавать видео на основе текстовых описаний. Среди них особенно выделяются китайские разработки Kling и video-01 от компании Minimax, пришедшие на смену Sora.
Kling может генерировать видео в высоком качестве с разрешением 1080p, однако доступ к нему ограничен только для пользователей с китайскими номерами телефонов. В отличие от Kling, video-01 доступен на платформе Hailuo AI, что делает его использование возможным для всех желающих.
Издание Ars Technica провело тестирование video-01, применяя запросы, которые ранее использовались для Runway Gen-3. Результаты работы Minimax оказались сопоставимыми с показателями Gen-3, хотя и с некоторыми отличиями. В основном, качество видео произвело положительное впечатление.
Модели искусственного интеллекта успешно комбинируют элементы из своих учебных данных, но сталкиваются с определенными трудностями, когда речь идет о создании совершенно новых сценариев, таких как древнетюркская маска. Несмотря на эти ограничения, Minimax демонстрирует впечатляющие результаты, что свидетельствует о его высоком потенциале в данной области.