Языковая модель Sbers и языковая модель SberDevicess признаны во всем мире как наиболее эффективные
Сбер давно работает с трансформерными моделями — еще в 2019 году были обучены русскоязычные модели ruBERT и ruGPT-2, а в 2020 году при помощи суперкомпьютера Christofari была создана ruGPT-3.Lenta.ru
Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка.Lenta.ru
Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста.Lenta.ru
Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 млрд параметров и 24 слоя.CNews