Исследовательская группа Сбербанка разработала инновационную технологию, позволяющую значительно повысить точность распознавания русской речи искусственными системами обработки естественного языка. По заявлению представителей компании, новая методика устраняет необходимость использования больших объемов специально подготовленных и маркированных аудиоматериалов, снижая затраты на обучение нейронных сетей. Метод основан на модификации популярной архитектуры трансформеров типа HuBERT, однако ключевым отличием стало использование семантического анализа данных вместо традиционных акустических признаков. Этот подход позволил создать высокоэффективный алгоритм предобучения, способный качественно обрабатывать большие объемы необработанного звукового материала. Основатель проекта и руководитель технического направления GigaChat Сбербанк Фёдор Минькин отметил, что эта технология станет прорывом в области русскоязычных систем распознавания речи, особенно учитывая сложность адаптации технологий д
Разработка Сбера улучшит распознавание русского языка
21 августа 202521 авг 2025
1 мин