"Что думают о нас там" - статья является сжатым подведением итогов сбора информации о "Положении в России с развитием нейросетей" от зарубежных специалистов, от инсайдерских источников, зарубежной прессы и моих личных контактов. Это мои личные выводы, лишенные какой-либо эмоциональной окраски, на основании сбора мною информации за последний год. В статье приведен примерный расчет стоимости создания и поддержки современной нейросети уровня GPT-4(5).
Как обстоят дела с нейросетями в России
Положение дел в разработке Российских нейросетей сегодня — это смесь реальной инженерии, громких маркетинговых релизов, ограничений из-за санкций и растущего влияния государственных задач. Ниже — картина, опираясь на внешние инсайдерский источники, а не на разрекламированные пресс-релизы из России.
Крупные игроки вроде Яндекса и Сбера действительно сделали заметные шаги: у Яндекса есть коммерческая линейка моделей и облачные сервисы YandexGPT, которые активно продвигают как продукт для бизнеса. Это видно в документации и релиз-нотах компании.
Сбер на полном серьёзе говорит о собственных генеративных моделях и о том, что у России есть кадры и шанс усилить позиции в AI, но в тех же заявлениях менеджмента признают ограничения по вычислительным мощностям и доступу к зарубежному оборудованию после санкций. Важно помнить: официальные оптимистичные заявления часто окрашены корпоративным PR.
Санкции и уход многих западных вендоров реально сказываются. Доступ к современным GPU и специализированным чипам ограничен, и это ограничение заставляет архитекторов искать обходные пути: оптимизация под менее мощный железо, использование распределённых кластеров внутри страны и попытки локализации производства компонентов. Это не миф — это практическая реальность.
Из этого вытекает очевидный факт: темпы «настоящих» исследований (на уровне топовых международных архитектур, сравнимых с западными лидерами) замедляются не потому, что у россиян нет ума, а потому что нет доступа к тому же стеку инструментов и инфраструктуры. Люди умеют думать — но без мощного железа далеко не уедешь в исследованиях больших моделей.
Тем не менее, российские команды умеют добираться до результатов хитростью: облегчённые модели, квантование, знание-ориентированные подходы и многопроходные пайплайны. Это рабочие паттерны, а не «пластиковый успех» PR-отчётов.
Наличие талантов — реальность.
Многие инженеры возвращаются домой из-за закрытия границ, семейных причин или экономических факторов. Но «талант» не равен «всё необходимое для прорыва». Без экосистемы и свободного доступа к сообществу и железу талант часто используется для прикладных задач: автоматизация, аналитика, опытные системы для бизнеса и государства.
Государственный интерес огромен.
AI рассматривается как инструмент безопасности, пропаганды и оборонных задач. Часть проектов прямо связана с военными и оборонными подрядчиками, и это влияет на приоритеты исследований — больше прикладных, меньше фундаментальных открытий, доступных всему миру.
Открытые репозитории и международное сообщество — большая боль.
С одной стороны, "open source" даёт доступ к идеям и реализации; с другой — появилось много сигналов о том, что государства и прокси-группы пытаются влиять на "open source", внедрять уязвимости или использовать код в интересах атаки и пропаганды. Это глобальная проблема, и на неё указывают западные аналитики.
«Втихаря использует чужие разработки под своим именем» — тут важно разбирать конкретные кейсы. На рынке есть практики репака чужих моделей, упаковки их под локальные бренды с дообучением на своих данных или даже перепаковки публичных моделей нейрсетей как «локальной разработки». Это не всегда криминал в юридическом смысле (зависит от лицензии и поставок), но это, честно говоря, обычный индустриальный приём, который рекламируется как «Наш прорыв». Аналитики и журналисты неоднократно фиксировали такие случаи.
Коммерческая экосистема множится: стартапы, интеграторы, облачные сервисы. Многие из них продают уже готовые решения и узкоспециализированные модели — чат-боты для поддержки, автоматизация документооборота, распознавание речи и видеоаналитика. Это реальная экономика вокруг AI, где платят и где создаются реальные продукты.
Но спрос и монетизация часто требуют компромиссов: модели уменьшают размеры, урезают контекст, пытаются экономить на инфраструктуре. В итоге коммерческие продукты могут выглядеть впечатляюще в демо, но иметь ограничения, которые заказчику скрывают до покупки.
Технологическая самообеспеченность — навязчивая тема.
Властные структуры требуют «своего стека» и «суверенных» решений. Это породило инвестиции в локальные дата-центры, собственные фреймворки и попытки замещения импортных компонентов. Работает частично — плюс к независимости, минус к совместимости и скорости инноваций.
Кадровая проблема — не только отток.
Внутри страны есть дефицит опытных исследователей уровня ведущих авторов, которым нужен международный обмен и публикации. Публикации идут, но международное влияние снижается из-за ограничения сотрудничества и доступа к конференциям. Это сдерживающий фактор для появления «новых архитектур» мирового класса.
Контрпродуктивная цензура и контроль интернета тоже мешают. Ограничения доступа к информации, блокировки, частые перебои связи в некоторых регионах снижают качество сотрудничества и скорость разработки. Это не кричащая проблема для всех, но она есть и бьёт по распределённым командам.
Безопасность и злоупотребления — отдельная строка расходов.
Российские нейросети активно используются в информационных операциях и пропаганде. Это не теория заговоров: западные институции российские сети связывают с системами ботов и дезинформации, а следы использования AI в подобных кампаниях документируются.
Контакт с международными инструментами — двойной.
С одной стороны, российские инженеры используют общедоступные библиотеки и идею трансформеров, репозитории Hugging Face и пр. С другой — прямой доступ к облачным сервисам иностранных компаний и специализированному железу ограничен. Это вынуждает к гибридным решениям: локальные кластера + публичные репозитории идей.
Про «эмбарго на научное сотрудничество» — да, оно есть и ослабляет обмен. Но часть академических и коммерческих связей всё ещё существует через нейтральные площадки, выставки и неформальные контакты. Это не как до 2022 года, но не полный разрыв.
Юридическая среда и регуляция развиваются. Властные структуры задают рамки: суверенный интернет, требования к данным, ограничения экспорта технологий. Это формирует спрос на локальные «соответствующие регуляциям» решения, но одновременно усложняет интеграцию с мировой экосистемой.
Инфраструктура данных — слабое место.
Для конкурентоспособных LLM нужно огромные, разнообразные и легально доступные датасеты. В России с этим сложнее: доступ к некоторым типам данных затруднён, а создание крупных, этических и лицензированных датасетов не так масштабно, как на западе. Это технически решаемо, но дорого и долго.
Примерные затраты времени и средств
на создание модели нейросети:
1. Исследования и разработка (R&D)
Сюда входит зарплата исследователей, инженеров, дата-сайентистов, менеджеров и юристов. У OpenAI и аналогичных компаний над моделью работают сотни людей.
- Затраты: примерно 500 млн – 1 млрд $
- Время: 1–2 года активной разработки, тестов и улучшений до выпуска
2. Сбор и очистка данных
Обучение требует сотен миллиардов токенов, тексты собираются из интернета, лицензируются или генерируются искусственно. Нужна фильтрация, разметка, проверка качества.
- Затраты: 50–100 млн $
- Время: от пары месяцев до года параллельно с исследованиями и разработкой.
3. Обучение модели
Это самое дорогое. По инсайдерским данным, GPT-4 стоило от 60 до 100 млн $ только на GPU-время. GPT-5 может быть на порядок дороже, т.к. нужны десятки тысяч топовых GPU (например NVIDIA H100 или A100).
- Инфраструктура: кластер в 10–30 тыс. GPU
- Стоимость аренды/закупки:
H100 стоит ~30–40 тыс. $ за штуку → 300 млн – 1 млрд $ только на «железо»
Если арендовать у Azure/AWS, будет ещё дороже. - Электроэнергия: одна H100 ≈ 700 Вт нагрузки
20 тыс. GPU × 0.7 кВт = 14 МВт
Тренировка может идти 2–3 месяца без остановки
Потребление ~1 ГВт·ч в месяц → около 3 ГВт·ч за цикл
Цена: 0.1 $/кВт·ч → 300 тыс. $ только электричество
(мелочь по сравнению с GPU) - Примерная стоимость обучения: 100 млн – 1.5 млрд $
4. Поддержка и обслуживание (инференс)
Инференс (от английского inference) — это стадия работы нейросети, когда она не учится, а отвечает на запросы пользователей.
После выпуска модель нужно «крутить» в продакшене. Тут расходы даже больше, чем на обучение, т.к. миллионы пользователей делают запросы ежедневно.
- Кластеры: десятки тысяч GPU для обслуживания
- Стоимость: от 500 млн. до 2 млрд. долларов в год
- Электроэнергия: сотни мвт. потребляемой мощности
5. Итого
- Исследования и подготовка: ~0.5–1 млрд $
- Данные: ~0.1 млрд $
- Обучение: 0.1–1.5 млрд $
- Инфраструктура для продакшена: 0.5–2 млрд $/год
Суммарные затраты на запуск уровня GPT-5: примерно 1–3 млрд $
Поддержка ежегодно: ещё 1–2 млрд $
Время
- Подготовка: 6–12 месяцев
- Тренировка: 2–3 месяца (может быть несколько циклов)
- Тесты и оптимизация: ещё 3–6 месяцев
Это как ответ на вопрос:
- "Почему наши не могут сделать то же самое?"
Примечание автора: Да просто потому, что никто "из наших" не будет рисковать такими деньгами (да и нет их у них), поскольку отсутствует личная материальны заинтересованность, а, если и присутствует, то только "Как от такого пирога отщипнуть в личный карман".
Есть интересная миграция фокуса: от «великой универсальной модели» к «модели-решению» для конкретной отрасли. Это практично: меньше вычислений, быстрее отдача, проще монетизировать. Банки, ритейл, госсектор покупают решения, а не архитектуры. Это приносит деньги и образует индустрию, но не делает лидеров науки.
В ряде случаев компании действительно предпринимали попытки «показать результат любой ценой»: дообучение и упаковка чужих weights под локальную марку, амплификация результатов на внутренних тестах и сильный маркетинг. Жёсткие проверки извне часто выявляют такие практики.
Кибербезопасность и бэкдоры — скрытая угроза.
Исследования показывают усилия по подсадке вредоносных патчей в "open source" и попытки использовать открытые инструменты в атакующих сценариях. Это фактор риска для всей экосистемы разработки и доверия.
Образовательная база держится. Университеты всё ещё выпускают сильных инженеров и аналитиков. Проблема в том, что лучшие уезжают, а те, кто остаётся, часто уходит в коммерцию из-за зарплат и задач. Тем не менее, в вузах появляются курсы по ML и AI, и это даёт долгосрочную подпитку кадрами.
Финансирование идёт из двух каналов: частного и государственного. Частный сектор инвестирует в продукты и сервисы с прямой монетизацией. Государство направляет деньги в проекты, которые считаются стратегическими, иногда с упором на безопасность и контроль. Это формирует диссонанс между научной открытостью и прагматизмом.
Стартапы, которые ориентируются на экспорт и сотрудничество с Западом, страдают сильнее. Те, кто ориентирован на внутренний рынок или дружественные страны, находят возможности и клиентов. Это перераспределение рынков влияет на архитектуры и приоритеты разработки.
Наблюдается практическая конвергенция: компании, которые раньше занимались поиском и рекламою, переключились на коммерческие AI-решения. Это наблюдалось у Яндекса и других больших игроков — их бизнес-задачи диктуют развитие AI внутри экосистемы.
Международная репутация российских исследований пострадала. Даже качественные работы чаще воспринимаются под подозрением из-за геополитики и ограниченного участия в конференциях. Это тормозит прямое влияние российских идей на мировую научную повестку.
Технологии генерации контента в России активно используются в медиа и рекламе. Это приносит практическую пользу бизнесу, но также усиливает проблему "deepfake" и массового введения в заблуждение аудитории. Регулирование тут запаздывает.
Чтобы резюмировать без PR-шароваров:
- Россия обладает интеллектом и инженерной культурой, которые позволяют делать серьёзные вещи в ML и AI. Но ей не хватает свободного доступа к вычислениям, к мировому сообществу и к некоторым компонентам цепочки поставок. Это делает рынок более прикладным и практичным, чем фундаментально революционным.
Из негатива:
- Репак чужих моделей под своим брендом
- Использование AI для пропаганды
- Попытки вмешательства в "open source"
- Проблемы с безопасностью
... всё это реальные и документированные западом явления. Параллельно идёт стройка локальных дата-центров и облачных сервисов, чтобы уменьшить зависимость от зарубежных, но испытывается дефицит нужной техники из-за санкций.
Из позитивов:
- Внутренняя адаптация технологий даёт быстрые прикладные результаты, развивается рынок решений, появляются клиентоориентированные продукты, и в учебных заведениях всё ещё растут кадры. Это даёт устойчивую, пусть и ограниченную, экосистему.
Мой совет читателю: не верьте только внутренним пресс-релизам. Смотрите на независимые отчёты, на техническую документацию, на доступность инфраструктуры и на реальные кейсы внедрения у клиентов. Именно так формируется адекватная картина.
О лидерах Российского рынка в области нейросетей
Яндекс
Когда Яндекс только появился в конце 1990-х, интернет в России был совсем другим. Люди искали информацию буквально «наугад»: открывали по двадцать вкладок, проматывали страницы, возвращались назад и снова искали. Сайты были громоздкими, неудобными, с кучей рекламы и бессмысленного текста. И вот в этом хаосе появилась небольшая команда, которая решила:
- «Надо сделать поиск, который реально понимает, что хочет человек».
И они сделали это.
Первые годы были экспериментальными. Ошибки были смешными: один из инженеров рассказывал, как вводил «погода в Москве», а система выдавала статьи про модные тенденции в Париже. Смех, исправления, долгие ночи за компьютером — так рождаются технологии.
Со временем Яндекс вырос в огромную экосистему. Почта, карты, облако, Алиса, видео, музыка, маркетплейс — всё это объединено в единую цифровую среду. Алиса стала отдельной «звездой». Люди шутят:
- «Спросил у Алисы, как доехать на работу, а она предложила три маршрута, предупредила о пробках и сказала, что в кафе на пути новый сезон роллов».
Но у Яндекса есть ограничения. Санкции, дефицит оборудования и государственный контроль заставляют инженеров искать обходные пути. Мощные модели, которые раньше запускались без проблем, теперь приходится оптимизировать и тестировать на доступных серверах. Один разработчик сказал:
- «Мы строим небоскрёб, но половину кирпичей нам не дают. И всё равно люди живут в нём».
YandexGPT встроен в поиск и Алису. Блогеры, студенты, предприниматели — каждый находит для себя что-то полезное. Можно просто попросить: «Сделай текст про путешествие в Петербург», и получить несколько вариантов. Для бизнеса это особенно важно: обработка писем, резюме, отзывов — экономия огромного времени.
Маркетинг любит говорить, что всё создано «с нуля», но на деле это комбинация собственных разработок и адаптации открытых технологий. Пользователям это неважно — главное, что инструмент работает.
Внутри России Яндекс востребован миллионами людей каждый день. Он понимает язык, культурные особенности, привычки пользователей — то, чего зарубежные аналоги часто не умеют.
Офис Яндекса живёт своей жизнью: сотрудники спорят о функциях, смеются над ошибками модели, обсуждают, как сделать поиск ещё умнее. Маленькие истории, случайные открытия, шутки — всё это делает технологии живыми. Один разработчик рассказывал:
- «Когда мы тестируем новые функции, иногда удивляемся, что Алиса отвечает так, будто понимает нас лучше, чем коллеги».
Сбер
Сбербанк: банк, который стал технологическим холдингом
Сбер долгое время был обычным банком. Вклады, кредиты, отделения, очереди — всё стандартно. Потом кто-то сказал:
- «А что если банк станет цифровой экосистемой?»
И это стало реальностью. Музыка, видео, маркетплейсы, мобильные приложения, гаджеты — финансовые услуги соседствуют с развлечениями и сервисами для бизнеса.
Особое место занимает искусственный интеллект. GigaChat — система, с которой можно общаться почти как с человеком. Предприниматель пишет: «Нужен текст для поста о скидках», а система предлагает несколько вариантов. Клиент спрашивает: «Как оформить кредит?» — и получает объяснение на понятном языке, с примерами.
Но не всё просто. Доступ к современному оборудованию ограничен, поэтому модели приходится оптимизировать. Тем не менее они реально помогают людям. Один пользователь написал:
- «Я не знаю, как бы я справлялся без Сбера сейчас. Всё под рукой: деньги, советы, документы».
Для бизнеса это тоже работает: автоматизация, аналитика, генерация текстов — экономия времени и сил.
Маркетологи любят говорить, что всё придумано «с нуля», но на самом деле это в основном доработка того, что уже было. Приложение устроено удобно, почти на уровне «сама всё подскажет»: напомнит про платеж, подскажет, где можно сэкономить, иногда даже неожиданно уведомит о бонусах — и ты думаешь: «А, точно, я забыл про это». Пользователи ощущают, что банк думает о них.
В офисах Сбера сотрудники обсуждают: «Как сделать ИИ ещё полезнее для людей?» Иногда спорят, иногда смеются: «GigaChat опять предложил странный вариант текста, но клиенту понравилось». Эти живые истории делают систему человечной.
Один менеджер рассказывал, как клиент спрашивал:
- «Можно ли мне сэкономить на коммуналке через приложение?»
И ему буквально через минуту предложили оптимальные варианты, которые реально сработали. Именно такие ситуации показывают, что технологии работают для людей, а не просто для отчётов и презентаций.
От автора:
Вот, примерно так и представляют за рубежом наше положение с развитием отечественных нейросетей. Понятно, что многое почерпнуто из интернет-прессы, т.е. от того, что компании сами и себе пишут в сети (следствие PR), но, тем не менее, я не особо заметил негатива по отношению в нашей стране в высказываниях и мнениях зарубежных специалистов.
P.S.