Компания SberDevices представила многоязычную версию нейросети GPT-3 — модель под названием mGPT может генерировать тексты на 61 языке. Это первая в мире генеративная модель, которая поддерживает такое количество языков. Она доступна в двух версиях — базовой, с 1,3 млрд параметров, опубликованной в открытом доступе в облачном хранилище СберДиск. И расширенной — с 13 млрд параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud. Модель mGPT показывает выдающиеся результаты на многих задачах few-shot и zero-shot learning: в этой области машинного обучения...
Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*). ruGPT-3.5 Внутри GigaChat находится целый ансамбль моделей — NeONKA (NEural Omnimodal Network with Knowledge-Awareness)...