Добавить в корзинуПозвонить
Найти в Дзене

Microsoft анонсировала три новых AI-модели — трансляция, голос и изображение

Microsoft представила три новые AI-модели: MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2, которые способны генерировать текст, голос и изображения. Эти модели укрепляют позицию Microsoft на рынке мультимодального ИИ, конкурируя с другими ведущими разработчиками, несмотря на продолжающееся партнёрство с OpenAI. С текущими инвестициями в AI-пространство, превышающими $13 миллиардов, Microsoft активно развивает собственные технологии, которые помогут ей добиться независимости от OpenAI. MAI-Transcribe-1 транскрибирует речь на 25 языках и работает в 2,5 раза быстрее, чем аналогичные решения на Azure. Эти цифры делают модель привлекательной для разработчиков и бизнеса. MAI-Voice-1 способен генерировать 60 секунд аудио за одну секунду, что открывает новые возможности для создания кастомизированных голосов. MAI-Image-2, в свою очередь, позволяет создавать видео-контент и был впервые представлен в MAI Playground в марте 2026 года. Все три модели доступны в Microsoft Foundry и имеют конкурентоспо
Оглавление

Microsoft представила три новые AI-модели: MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2, которые способны генерировать текст, голос и изображения. Эти модели укрепляют позицию Microsoft на рынке мультимодального ИИ, конкурируя с другими ведущими разработчиками, несмотря на продолжающееся партнёрство с OpenAI.

Контекст: усиливающаяся конкуренция

С текущими инвестициями в AI-пространство, превышающими $13 миллиардов, Microsoft активно развивает собственные технологии, которые помогут ей добиться независимости от OpenAI. MAI-Transcribe-1 транскрибирует речь на 25 языках и работает в 2,5 раза быстрее, чем аналогичные решения на Azure. Эти цифры делают модель привлекательной для разработчиков и бизнеса.

Детали новых моделей

MAI-Voice-1 способен генерировать 60 секунд аудио за одну секунду, что открывает новые возможности для создания кастомизированных голосов. MAI-Image-2, в свою очередь, позволяет создавать видео-контент и был впервые представлен в MAI Playground в марте 2026 года. Все три модели доступны в Microsoft Foundry и имеют конкурентоспособную ценовую политику: от $0,36 в час за MAI-Transcribe-1 до $33 за 1 миллион токенов для изображений.

Руководитель Microsoft AI Мустафа Сулейман подчеркивает, что команда нацелена на создание моделей, ориентированных на человека: «Мы ставим человека в центр, оптимизируя взаимодействие, основанное на реальных коммуникациях». Это делает новые модели более доступными и практичными для широкой аудитории.

Практическое значение для бизнеса

Новые решения от Microsoft могут значительно снизить затраты на разработку AI-приложений для российских компаний. Например, использование MAI-Transcribe-1 дает возможность оптимизировать рабочие процессы за счет быстрого и точного транскрибирования. Важно учитывать, что более низкие цены, чем у аналогов от Google и OpenAI, делают эти решения привлекательными для стартапов и малых предприятий.

Microsoft продолжает наращивать мощности в области AI-технологий. Следующий шаг — запуск ещё большего количества моделей, что укрепит их позиции на растущем рынке.

The post Microsoft анонсировала три новых AI-модели — трансляция, голос и изображение appeared first on iTech News.