Google анонсировала революционную модель искусственного интеллекта Veo 3, способную создавать видеоролики с синхронизированным звуковым сопровождением. Презентация состоялась на конференции для разработчиков I/O 2025, где компания также продемонстрировала новый инструмент для создания видеоконтента Flow и обновленную версию генератора изображений Imagen 4. Veo 3 стала первой моделью Google, умеющей объединять видеоряд с соответствующими звуками – от пения птиц до шума городского трафика. По заявлению разработчиков, новинка отлично справляется с моделированием "реальной физики" и синхронизацией движения губ с речью. На данный момент доступ к Veo 3 ограничен – технология работает только для американских подписчиков Gemini Ultra за $250 в месяц, корпоративных клиентов Vertex AI и пользователей нового инструмента Flow. Wtf, AI videos can have sound now? All from one model?
byu/Nyghl inChatGPT Flow объединяет возможности моделей Veo, Imagen и Gemini для создания кинематографических клипов