«Сбер» разработал лучшую языковую модель для русского языка

Сбер давно работает с трансформерными моделями — еще в 2019 году были обучены русскоязычные модели ruBERT и ruGPT-2, а в 2020 году при помощи суперкомпьютера Christofari была создана ruGPT-3.Lenta.ru
Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка.Lenta.ru
Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста.Lenta.ru
Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 млрд параметров и 24 слоя.CNews
Эта новость в СМИ