Найти тему
2014 подписчиков

👣 GigaAM: класс открытых моделей для обработки звучащей речи


Команда SberDevices показала свое семейство моделей для обработки речи, обученных на русском языке.

⏩GigaAM умеет быстро адаптироваться к разным задачам, от распознавания речи до взаимодействия с различными доменами (колл-центр, подкасты, farfield).

⏩GigaAM-CTC допускает на 20–37% меньше ошибок в словах на коротких русскоязычных запросах по сравнению с такими популярными решениями, как NeMo-Conformer-RNNT и Whisper-Large-v3.

⏩GigaAM-Emo умеет устанавливать связь с рядом паттернов, которые отвечают за эмоциональное состояние говорящего.

📎 github

Около минуты