Microsoft представила собственные модели для работы с голосом и изображениями — доступны через Microsoft Foundry и MAI Playground. MAI-Transcribe-1 — распознавание речи - 25 языков, включая русский - Субтитры, транскрибация звонков и переговоров - От $0,36 за час аудио MAI-Voice-1 — синтез речи с эмоциями - До 2 минут аудио за раз - От $22 за 1 млн символов MAI-Image-2 — генерация изображений по тексту - Обновлённая версия MAI-Image (октябрь 2025) - От $5 за 1 млн входных токенов 🔗 Источник