Qwen3.5-Omni — это новый уровень омни-модальной ИИ. Он понимает текст, изображения, аудио и видео, обеспечивая интеллект и интерактивность в реальном времени. Главная особенность — Audio-Visual Vibe Coding: просто опишите свою идею в камеру и Qwen3.5-Omni-Plus мгновенно создаст рабочий веб-сайт или игру. В оффлайне: — Скриптовая разметка видео с таймкодами, сценами и распределением спикеров. — Лидер по качеству: превосходит Gemini-3.1 Pro в аудио и сопоставим по аудиовизуальному пониманию. — Огромная память: до 10 часов аудио или 400 секунд 720p видео, обучен на 100 млн+ часов данных. — Поддержка 113 языков распознавания речи и 36 языков для общения. В реальном времени: — Точная настройка голоса: эмоции, скорость и громкость в реальном времени. — Встроенный веб-поиск и вызов сложных функций. — Клонирование голоса по короткому образцу (скоро в инженерном релизе). — Естественные разговоры: умное управление диалогом, понимание намерений и игнорирование шумов. Семейство Qwen3.5-Omni
Alibaba выпустил новую модель Qwen3.5-Omni
31 марта31 мар
14
1 мин