Больше новостей об IT в Telegram канале «Код Дурова» Главный русскоязычный бенчмарк по пониманию текстов Russian SuperGLUE провёл тест, по результатам которого в лидеры вышла языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5). Она лучше всего в мире понимает текст на русском языке, уступая по точности лишь человеку. Первые русскоязычные модели Сбер обучил ещё в 2019 году — ruBERT и ruGPT-2. Через год при помощи суперкомпьютера Christofari была создана модель ruGPT-3, существующая в разных вариантах. Самый большой из них насчитывает 13 млрд параметров. Но в отличие от семейства GPT, состоящих только из декодирующих блоков трансформера, FRED-T5 содержит кодирующие блоки. Это позволяет эффективнее справляться с задачами в области обработки естественного языка. Модель реализована на базе нейросети T5, имеет 1,7 миллиарда параметров и 24 слоя. Обучение проходило на задачах восстановления случайно удалённых фрагментов текста на суперкомпьютере Christofa
Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире
15 февраля 202315 фев 2023
9
1 мин