11 подписчиков

Сбер выложил MoE-модель на 702B параметров под MIT. В тот же день закон Минцифры прошёл 20 ведомств.

21 мая21 мая

10 мин

19-20 мая на российском рынке AI произошли два события, которые редко рассматривают вместе. Если рассматривать порознь - это новость о законопроекте и новость о релизе модели. Если вместе - это смещение всей логики выбора AI-стека для бизнеса от 10 до 200 человек. 19-20 мая на российском рынке AI произошли два события, которые редко рассматривают вместе. Если рассматривать порознь - это новость о законопроекте и новость о релизе модели. Если вместе - это смещение всей логики выбора AI-стека для бизнеса от 10 до 200 человек. Что произошло

Событие 1. Закон Минцифры о регулировании ИИ прошёл межведомственное согласование. В согласовании участвовали 20 ведомств, в том числе Центробанк, Москва, Министерство обороны, ФСБ. Законопроект вводит три ключевых понятия: «суверенная», «национальная» и «доверенная» модель ИИ. К дате вступления готовится около 17 подзаконных актов. Подход к регулированию - риск-ориентированный. Чем выше потенциальный вред от применения модели (госуправление, медицина

Что произошло

Событие 1. Закон Минцифры о регулировании ИИ прошёл межведомственное согласование.

В согласовании участвовали 20 ведомств, в том числе Центробанк, Москва, Министерство обороны, ФСБ. Законопроект вводит три ключевых понятия: «суверенная», «национальная» и «доверенная» модель ИИ. К дате вступления готовится около 17 подзаконных актов.

Подход к регулированию - риск-ориентированный. Чем выше потенциальный вред от применения модели (госуправление, медицина, финансы), тем жёстче требования. Срок вступления в силу - 1 сентября 2027 года.

Источники: garant.ru, mentoday, материалы пресс-службы Минцифры.

Событие 2. GigaChat 3.1 Ultra на HuggingFace, лицензия MIT.

В тот же день Sber выложил в открытый доступ модель GigaChat 3.1 Ultra. Архитектура: 702 миллиарда параметров total, 36 миллиардов активных в каждый момент работы. Это первая российская модель класса Mixture of Experts (MoE) такого масштаба под открытой коммерчески разрешённой лицензией.

Технические особенности: тренировка через DPO (Direct Preference Optimization), нативная работа в формате FP8 (пониженная точность, ускоряет инференс и уменьшает требования к памяти), поддержка многошаговых задач с рассуждениями.

Бенчмарки. На CC-Bench V2 (тесты на реальных задачах разработки): 98% успешных сборок, 71% на React-задачах (Claude Opus 4.6 - 70.7% на тех же тестах). По полным решениям сложных задач: 34.6% против 39.7% у Opus. Это не паритет, но это рабочий уровень для коммерческой эксплуатации.

Как изменилась карта AI-стеков для российского бизнеса

До этой недели я выделял 4 ветки выбора для компаний:

Ветка 1. Cloud-vendor. Anthropic Claude, OpenAI GPT, Google Gemini. Покупка API напрямую или через посредника. Высокое качество, минимум настройки.

Минусы: правовые риски, нестабильная доступность из РФ, зависимость от вендора.

Ветка 2. Hybrid (гибридная). Часть нагрузки в облаке зарубежного вендора, часть локально. Появилась после сделок OpenAI + Dell (Codex on-premise) и AWS + Claude.

Минусы: сложная архитектура, дорогое сопровождение.

Ветка 3. On-prem (на своём железе). Open-weight модели (LLaMA, Mistral, Qwen, DeepSeek) на собственных серверах с GPU. Полный контроль.

Минусы: высокий порог входа, нужны GPU, нужна команда.

Ветка 4. Open-source с независимым аудитом. Open-weight модели плюс внешняя проверка безопасности и соответствия. Подходит регулируемым отраслям, которые не хотят отдавать данные облаку, но и не готовы сами всё аудировать. Минусы: дорого, мало надёжных аудиторов на рынке.

После 19-20 мая появилась 5-я ветка:

Ветка 5. Regulated-sovereign (регулируемая суверенная). Российские модели, российские датасеты, российские дата-центры.
До этой недели единственный игрок был YandexGPT (закрытая модель Яндекса) и T-Pro от Т-Технологий.
Теперь добавляется GigaChat 3.1 Ultra под MIT - модель, которую можно скачать, посмотреть, дообучить, развернуть у себя или у независимого провайдера в РФ.

Закон Минцифры с сентября 2027 года сделает эту ветку обязательной для регулируемых отраслей. Сегодня - это выбор. Через 16 месяцев - это требование.

Почему 16 месяцев - это мало

Цифра «1 сентября 2027» звучит как горизонт планирования. На практике для бизнеса от 10 до 200 человек это близкий срок.

Реальная миграция AI-инфраструктуры включает:

Аудит текущих AI-сценариев (1-2 месяца). Какие модели используются, на каких этапах процессов, какие данные обрабатывают, какие интеграции зависят от конкретной модели.
Выбор стека под новый режим (1 месяц). С учётом требований к суверенности и доверенности.
Пилот на новой ветке (2-3 месяца). Реальная нагрузка, реальные данные, реальные пользователи.
Перенос процессов (3-4 месяца). Постепенная миграция с откатом возможностей в случае проблем.
Сертификация и согласование с регулятором (1-3 месяца). Особенно для финансов и медицины.

Итого: 8-13 месяцев чистого календарного времени. Если начать в июне 2026 - попадаете в срок. Если откладывать до Q1 2027 - попадаете в гонку с дедлайном.

Что делать на этой неделе

Если ваш бизнес в регулируемой отрасли (финансы, медицина, госзаказы, образование):

Запросите у юриста: проект закона об ИИ + проект изменений в 152-ФЗ + перечень подзаконных актов в работе. На сайтах garant.ru и regulation.gov.ru тексты находятся в открытом доступе.
Зафиксируйте текущий AI-стек письменно. Какие модели, какие задачи, какие данные. Это нужно будет для оценки рисков.
Заложите в бюджет 2026 года статью на миграцию. Не «потом разберёмся», а конкретная сумма с обоснованием.

Если ваш бизнес не регулируется напрямую, но есть GenAI в работе:

Дайте задачу IT-команде или подрядчику развернуть GigaChat 3.1 Ultra локально (для бенчмарка, не для прода). Узнаете требования к железу и сравните с тем, что используете сейчас.
Введите в архитектуру AI-сценариев принцип переключаемости моделей. Не привязывайтесь к API конкретного вендора. Используйте обёртки (например, LiteLLM, OpenAI-compatible endpoints), которые позволяют поменять модель за час, не за месяц.
Подпишитесь на изменения по законопроекту. Текст ещё будет меняться, подзаконные акты появятся в 2026-2027.

Если вы только планируете внедрять AI в бизнес-процессы:

Хорошие новости. У вас не будет легаси-долга на момент 1 сентября 2027 года. Плохие новости: ваш выбор архитектуры на ближайшие 18 месяцев должен учитывать сразу 5 веток, а не 3.

Простое правило: не строите AI-зависимые процессы на одной модели от одного вендора без плана миграции.

Главный сдвиг

Закон Минцифры превращает выбор AI-стека из технического решения в стратегическое.

До этой недели можно было «попробовать Claude, понравится - перейти, не понравится - вернуться на GPT». Через 16 месяцев это уже не работает. Регулируемые отрасли получат обязательство по суверенным моделям. Нерегулируемые тоже почувствуют сдвиг через инфраструктурные ограничения (хостинг, оплата, доступ).

Окно для тех, кто умеет грамотно выбирать стек и помогать миграции, на ближайшие 24-36 месяцев очень широкое.

Что произошло