2014 подписчиков
👣 GigaAM: класс открытых моделей для обработки звучащей речи
Команда SberDevices показала свое семейство моделей для обработки речи, обученных на русском языке.
⏩GigaAM умеет быстро адаптироваться к разным задачам, от распознавания речи до взаимодействия с различными доменами (колл-центр, подкасты, farfield).
⏩GigaAM-CTC допускает на 20–37% меньше ошибок в словах на коротких русскоязычных запросах по сравнению с такими популярными решениями, как NeMo-Conformer-RNNT и Whisper-Large-v3.
⏩GigaAM-Emo умеет устанавливать связь с рядом паттернов, которые отвечают за эмоциональное состояние говорящего.
📎 Статья
📎 github
Около минуты
9 апреля 2024