Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*). ruGPT-3.5 Внутри GigaChat находитсяцелый ансамбль моделей — NeONKA (NEural Omnimodal Network withKnowledge-Awareness). Для его создания нужно было выбрать базовую языковуюмодель, которую потом можно было обучать на инструктивных данных. RussianGenerative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3.513B) — новая версия нейросети ruGPT-3 13B. Это современная модельгенерации текста для русского языка на основе доработанной исследователямиСбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардовпараметров и умеет продолжать тексты на
Сбер открыл доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке
20 июля 202320 июл 2023
34
2 мин