В отделе SberDevices, передовом техническом подразделении Сбербанка, группа экспертов в области искусственного интеллекта и обработки речи совершила значительный прорыв. Они разработали новейшую нейросеть GigaAM, способную с беспрецедентной точностью распознавать человеческую речь на русском языке и определять эмоциональную окраску высказываний. Согласно заявлениям разработчиков, GigaAM была обучена на колоссальном объеме разнообразных речевых данных, включая записи из различных источников – от запросов в умные колонки до телефонных разговоров. Благодаря этому она превосходит ведущие ИИ-решения в сфере распознавания речи, такие как NeMo-Conformer-RNNT и Whisper-Large-v3, допуская на 20-35% меньше ошибок в словах при распознавании коротких запросов. GigaAM представляет собой не просто отдельную модель, а целое семейство продвинутых акустических моделей с открытым исходным кодом, что делает их доступными для использования, улучшения и адаптации под конкретные нужды разработчиков по всему