Найти в Дзене
Техносуверен

Суверенный ИИ: в «Сбере» объяснили, почему России нужны собственные нейросети

Илья Тушев / Вести Подмосковья Построение независимой, «суверенной» системы ИИ — это ключевое условие для разработки высококачественных моделей и достижения технологической независимости. Это позволяет снизить угрозы, вызванные внешними обстоятельствами, например, возможной блокировкой зарубежных технологий. Такое мнение в беседе с РБК высказал Антон Фролов, старший вице-президент Сбербанка, курирующий направление генеративного ИИ. В понимании Сбера «суверенность» означает абсолютное управление самой ресурсоемкой технологической стадией — предварительным обучением (претрендом) модели. Сбер изначально принял стратегию самостоятельного обучения базовой языковой модели для «ГигаЧата», избегая использования открытых архитектур других компаний. Фролов объяснил, что применение готовых открытых решений и их дальнейшая адаптация могут привести к потере моделью базовых, фундаментальных знаний. При этом в процессе обучения, включая этап претрейна, применялись как российские, так и иностранные да

Илья Тушев / Вести Подмосковья

Построение независимой, «суверенной» системы ИИ — это ключевое условие для разработки высококачественных моделей и достижения технологической независимости. Это позволяет снизить угрозы, вызванные внешними обстоятельствами, например, возможной блокировкой зарубежных технологий. Такое мнение в беседе с РБК высказал Антон Фролов, старший вице-президент Сбербанка, курирующий направление генеративного ИИ.

В понимании Сбера «суверенность» означает абсолютное управление самой ресурсоемкой технологической стадией — предварительным обучением (претрендом) модели. Сбер изначально принял стратегию самостоятельного обучения базовой языковой модели для «ГигаЧата», избегая использования открытых архитектур других компаний. Фролов объяснил, что применение готовых открытых решений и их дальнейшая адаптация могут привести к потере моделью базовых, фундаментальных знаний.

При этом в процессе обучения, включая этап претрейна, применялись как российские, так и иностранные данные. Так как основной объем мировых знаний представлен на английском, исключать их было нецелесообразно. Ключевой задачей, по словам Фролова, является не исходный источник данных, а их тщательная обработка, фильтрация и корректировка весов: российским текстам, культурным контекстам и локальным знаниям намеренно придаётся больший приоритет. Это необходимо для того, чтобы модель формировала ответы через призму российской культуры и реалий. Суверенность, таким образом, понимается как усиление национальной идентичности.

Однако остается актуальной проблема недостатка качественного цифрового российского контента. В результате ИИ иногда производит ответы, опирающиеся на западные источники — например, может представлять Винни-Пуха согласно версии Disney, а не по образцу советской мультипликации. Как отмечает Фролов, одна из целей суверенного ИИ — точное распознавание культурных кодов. Россия имеет значительное культурное и научное наследие: архивы, библиотеки, исторические документы, долгое время существовавшие только в бумажной форме. Сейчас этот ресурс активно преобразуется в цифру промышленностью и научными кругами, что медленно, но увеличивает российское пространство данных.

Для непрерывного прогресса нейросетевых моделей данных всегда будет не хватать, резюмировал представитель Сбера. Чем больше будет проектов, сосредоточенных на увеличении объема и улучшении обработки этих данных, тем более совершенные и соответствующие потребностям решения можно будет строить.