23,9 тыс подписчиков

Google научила ИИ генерировать видео со звуком

21 мая 202521 мая 2025

1 мин

Google анонсировала революционную модель искусственного интеллекта Veo 3, способную создавать видеоролики с синхронизированным звуковым сопровождением. Презентация состоялась на конференции для разработчиков I/O 2025, где компания также продемонстрировала новый инструмент для создания видеоконтента Flow и обновленную версию генератора изображений Imagen 4. Veo 3 стала первой моделью Google, умеющей объединять видеоряд с соответствующими звуками – от пения птиц до шума городского трафика. По заявлению разработчиков, новинка отлично справляется с моделированием "реальной физики" и синхронизацией движения губ с речью. На данный момент доступ к Veo 3 ограничен – технология работает только для американских подписчиков Gemini Ultra за $250 в месяц, корпоративных клиентов Vertex AI и пользователей нового инструмента Flow. Wtf, AI videos can have sound now? All from one model?

byu/Nyghl inChatGPT Flow объединяет возможности моделей Veo, Imagen и Gemini для создания кинематографических клипов

Veo 3 стала первой моделью Google, умеющей объединять видеоряд с соответствующими звуками – от пения птиц до шума городского трафика. По заявлению разработчиков, новинка отлично справляется с моделированием "реальной физики" и синхронизацией движения губ с речью. На данный момент доступ к Veo 3 ограничен – технология работает только для американских подписчиков Gemini Ultra за $250 в месяц, корпоративных клиентов Vertex AI и пользователей нового инструмента Flow.

Wtf, AI videos can have sound now? All from one model?
byu/Nyghl inChatGPT

Flow объединяет возможности моделей Veo, Imagen и Gemini для создания кинематографических клипов и сцен. Пользователи могут описать желаемый результат обычным языком, а система автоматически сгенерирует соответствующий видеоконтент. Сервис пока доступен только американским подписчикам Google AI Pro и Ultra, но компания обещает скоро расширить географию.

Google также продолжает поддерживать предыдущую версию видеогенератора. Модель Veo 2 получила обновление с возможностью использовать изображения людей, сцен, стилей и объектов в качестве референса для создания видео в Flow. Пользователи смогут управлять камерой, масштабировать сцены, менять пропорции кадра и добавлять или удалять объекты из роликов.

Imagen 4 – новое поколение генератора изображений от Google, теперь создает детализированные текстуры (сложные ткани, шерсть животных) с высокой четкостью и отлично справляется как с фотореалистичными, так и с абстрактными изображениями. Модель значительно лучше работает с типографикой и поддерживает различные пропорции с разрешением до 2K. Imagen 4 уже интегрирована в приложение Gemini, Vertex AI и сервисы Workspace, включая Docs и Slides.

Комментарии на сайте