Microsoft представила три новые AI-модели: MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2, которые способны генерировать текст, голос и изображения. Эти модели укрепляют позицию Microsoft на рынке мультимодального ИИ, конкурируя с другими ведущими разработчиками, несмотря на продолжающееся партнёрство с OpenAI. С текущими инвестициями в AI-пространство, превышающими $13 миллиардов, Microsoft активно развивает собственные технологии, которые помогут ей добиться независимости от OpenAI. MAI-Transcribe-1 транскрибирует речь на 25 языках и работает в 2,5 раза быстрее, чем аналогичные решения на Azure. Эти цифры делают модель привлекательной для разработчиков и бизнеса. MAI-Voice-1 способен генерировать 60 секунд аудио за одну секунду, что открывает новые возможности для создания кастомизированных голосов. MAI-Image-2, в свою очередь, позволяет создавать видео-контент и был впервые представлен в MAI Playground в марте 2026 года. Все три модели доступны в Microsoft Foundry и имеют конкурентоспо
Microsoft анонсировала три новых AI-модели — трансляция, голос и изображение
2 апреля2 апр
1 мин