Добавить в корзинуПозвонить
Найти в Дзене
Машинное обучение

⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени

Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее. При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2.2%). keyword biasing для редких слов - имён собственных, медицинских терминов и поддержка 43 языков включая арабский, японский, китайский. Скорость такого уровня при точности из топ-3. https://microsoft.ai/news/introducingmai-code-1-flash/

⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени.

Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее.

При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2.2%).

keyword biasing для редких слов - имён собственных, медицинских терминов и поддержка 43 языков включая арабский, японский, китайский.

Скорость такого уровня при точности из топ-3.

https://microsoft.ai/news/introducingmai-code-1-flash/

-2
-3
-4