4 недели назад
⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени
Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее. При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2...