👍 Qwen выкатили сразу 3 модели для генерации изображений, озвучки и текста.
• Qwen3-TTS-Flash — преобразует текст в речь. Доступно 14 голосов, есть поддержка 10 языков, включая русский. Задержка всего 97 мс.
• Qwen-Image-Edit-2509 — редактирует и смешивает изображения, сохраняя контекст, лица и объекты. Также завезли ControlNet для точечного контроля поз персонажей.
• Qwen3-Omni — мультимодальная модель, которая работает с текстом, изображениями, аудио и видео. Поддерживает 119 языков, включая русский. Обрабатывает аудио длиной до 30 минут с задержкой 211 мс. Заняла первое место на 22 из 36 тематических бенчмарках.
Все модели доступны бесплатно, дерзайте ☕️
⏳⏳⏳⏳⏳⏳⏳⏳
Что такое SAV AI?
Он вам точно продаст!
Агенты, рефералы, дилеры
🫢 ИИрки - ИИ-рекламки в Телеграм
Участие в Папках и Подборках
Все видео и трансляции
Тут еще тестовый робот
#llm