Сбер, крупнейший банк в России, предоставил доступ к своей мощной модели ruGPT-3.5, которая является основой для их продукта GigaChat. Эта удивительная модель с лицензией MIT доступна для использования разработчиками в их коммерческих продуктах, предоставляя широкие возможности для интеграции искусственного интеллекта в различные приложения. Общее количество параметров в ruGPT-3.5 составляет ошеломляющие 13 миллиардов, что делает его одной из наиболее мощных и сложных моделей на сегодняшний день. Это позволяет модели обрабатывать огромные объемы информации и создавать высококачественные ответы. Кроме того, важным аспектом является использование контекста длиной в 2048 токенов при ответах модели. Это позволяет модели учитывать более широкий контекст и создавать более информативные и точные ответы. Чтобы достичь такого впечатляющего уровня производительности, модель ruGPT-3.5 была обучена на огромных объемах данных в два этапа. Первый этап включал 300 Гб данных из различных источников,