🎙 Только что выкатили — Qwen3-ASR-Flash!
Это не просто ASR, а универсальный слух от команды Qwen. Распознаёт речь на 11 языках — включая русский и китайский — и сам понимает, на каком языке ты говоришь. Никаких переключалок 👌
Что особенно круто — справляется даже с «тяжёлыми» аудио: рэп, фоновая музыка, шум, плохой микрофон или запись с другого конца комнаты — всё ей нипочём. WER (ошибок распознавания) меньше 8% даже там, где другие пасуют.
💬 В LocalLLaMA уже обсуждают: качество — огонь 🔥, но... только через API. Локально покрутить, потестить, пошаманить — нельзя. Народ слегка ноет, но признаёт — работает чертовски хорошо.
Кто уже пробовал? Делитесь впечатлениями
Ампилов про ИТ: https://dzen.ru/id/623d938f380f3715018b6e3c