Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее. При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2.2%). keyword biasing для редких слов - имён собственных, медицинских терминов и поддержка 43 языков включая арабский, японский, китайский. Скорость такого уровня при точности из топ-3. https://microsoft.ai/news/introducingmai-code-1-flash/
⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени
СегодняСегодня
59
~1 мин