Мир говорит на тысячах языков, но цифровая реальность — на десятках. До сих пор почти все системы распознавания речи знали лишь английский, китайский, французский, максимум сотню популярных языков. Остальные 95 % человечества для ИИ оставались немыми. Теперь Meta решила исправить это историческое неравенство, представив Omnilingual ASR — открытый набор моделей распознавания речи, охватывающий 1600+ языков, включая 500 низкоресурсных, которые искусственный интеллект никогда прежде не слышал. Omnilingual ASR — это не просто новый продукт, а исследовательский скачок. В его основе лежит массивный wav2vec 2.0 с 7 млрд параметров, обученный на аудио-корпусе, охватывающем 350 малораспространённых языков. 🧩 Главное отличие — архитектура, вдохновлённая LLM-подходами.
Meta впервые внедрила в распознавание речи in-context learning: теперь добавить новый язык можно буквально по нескольким примерам речи (3–5) — без длительного дообучения и без суперкомпьютеров. Это революционно. Для деревни в Каме