Найти в Дзене

Вышла в открытый доступ ruGPT-3.5 от Сбера!


   Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B, основанная на архитектуре OpenAI GPT-3.

Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.

Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT*).
Около минуты