89 тыс подписчиков

"Что думают о нас там" - мнения о развитии и лидерах рынка нейросетей в России от зарубежных специалистов. Обзор на осень 2025 года.

15 сентября 202515 сен 2025

14 мин

"Что думают о нас там" - статья является сжатым подведением итогов сбора информации о "Положении в России с развитием нейросетей" от зарубежных специалистов, от инсайдерских источников, зарубежной прессы и моих личных контактов. Это мои личные выводы, лишенные какой-либо эмоциональной окраски, на основании сбора мною информации за последний год. В статье приведен примерный расчет стоимости создания и поддержки современной нейросети уровня GPT-4(5). Положение дел в разработке Российских нейросетей сегодня — это смесь реальной инженерии, громких маркетинговых релизов, ограничений из-за санкций и растущего влияния государственных задач. Ниже — картина, опираясь на внешние инсайдерский источники, а не на разрекламированные пресс-релизы из России. Крупные игроки вроде Яндекса и Сбера действительно сделали заметные шаги: у Яндекса есть коммерческая линейка моделей и облачные сервисы YandexGPT, которые активно продвигают как продукт для бизнеса. Это видно в документации и релиз-нотах компании

Оглавление

Как обстоят дела с нейросетями в России
Примерные затраты времени и средств на создание модели нейросети:
О лидерах Российского рынка в области нейросетей

"Что думают о нас там" - статья является сжатым подведением итогов сбора информации о "Положении в России с развитием нейросетей" от зарубежных специалистов, от инсайдерских источников, зарубежной прессы и моих личных контактов. Это мои личные выводы, лишенные какой-либо эмоциональной окраски, на основании сбора мною информации за последний год. В статье приведен примерный расчет стоимости создания и поддержки современной нейросети уровня GPT-4(5).

Как обстоят дела с нейросетями в России

Положение дел в разработке Российских нейросетей сегодня — это смесь реальной инженерии, громких маркетинговых релизов, ограничений из-за санкций и растущего влияния государственных задач. Ниже — картина, опираясь на внешние инсайдерский источники, а не на разрекламированные пресс-релизы из России.

Крупные игроки вроде Яндекса и Сбера действительно сделали заметные шаги: у Яндекса есть коммерческая линейка моделей и облачные сервисы YandexGPT, которые активно продвигают как продукт для бизнеса. Это видно в документации и релиз-нотах компании.

Сбер на полном серьёзе говорит о собственных генеративных моделях и о том, что у России есть кадры и шанс усилить позиции в AI, но в тех же заявлениях менеджмента признают ограничения по вычислительным мощностям и доступу к зарубежному оборудованию после санкций. Важно помнить: официальные оптимистичные заявления часто окрашены корпоративным PR.

Санкции и уход многих западных вендоров реально сказываются. Доступ к современным GPU и специализированным чипам ограничен, и это ограничение заставляет архитекторов искать обходные пути: оптимизация под менее мощный железо, использование распределённых кластеров внутри страны и попытки локализации производства компонентов. Это не миф — это практическая реальность.

Из этого вытекает очевидный факт: темпы «настоящих» исследований (на уровне топовых международных архитектур, сравнимых с западными лидерами) замедляются не потому, что у россиян нет ума, а потому что нет доступа к тому же стеку инструментов и инфраструктуры. Люди умеют думать — но без мощного железа далеко не уедешь в исследованиях больших моделей.

Тем не менее, российские команды умеют добираться до результатов хитростью: облегчённые модели, квантование, знание-ориентированные подходы и многопроходные пайплайны. Это рабочие паттерны, а не «пластиковый успех» PR-отчётов.

Наличие талантов — реальность.

Многие инженеры возвращаются домой из-за закрытия границ, семейных причин или экономических факторов. Но «талант» не равен «всё необходимое для прорыва». Без экосистемы и свободного доступа к сообществу и железу талант часто используется для прикладных задач: автоматизация, аналитика, опытные системы для бизнеса и государства.

Государственный интерес огромен.

AI рассматривается как инструмент безопасности, пропаганды и оборонных задач. Часть проектов прямо связана с военными и оборонными подрядчиками, и это влияет на приоритеты исследований — больше прикладных, меньше фундаментальных открытий, доступных всему миру.

Открытые репозитории и международное сообщество — большая боль.

С одной стороны, "open source" даёт доступ к идеям и реализации; с другой — появилось много сигналов о том, что государства и прокси-группы пытаются влиять на "open source", внедрять уязвимости или использовать код в интересах атаки и пропаганды. Это глобальная проблема, и на неё указывают западные аналитики.

«Втихаря использует чужие разработки под своим именем» — тут важно разбирать конкретные кейсы. На рынке есть практики репака чужих моделей, упаковки их под локальные бренды с дообучением на своих данных или даже перепаковки публичных моделей нейрсетей как «локальной разработки». Это не всегда криминал в юридическом смысле (зависит от лицензии и поставок), но это, честно говоря, обычный индустриальный приём, который рекламируется как «Наш прорыв». Аналитики и журналисты неоднократно фиксировали такие случаи.

Коммерческая экосистема множится: стартапы, интеграторы, облачные сервисы. Многие из них продают уже готовые решения и узкоспециализированные модели — чат-боты для поддержки, автоматизация документооборота, распознавание речи и видеоаналитика. Это реальная экономика вокруг AI, где платят и где создаются реальные продукты.

Но спрос и монетизация часто требуют компромиссов: модели уменьшают размеры, урезают контекст, пытаются экономить на инфраструктуре. В итоге коммерческие продукты могут выглядеть впечатляюще в демо, но иметь ограничения, которые заказчику скрывают до покупки.

Технологическая самообеспеченность — навязчивая тема.

Властные структуры требуют «своего стека» и «суверенных» решений. Это породило инвестиции в локальные дата-центры, собственные фреймворки и попытки замещения импортных компонентов. Работает частично — плюс к независимости, минус к совместимости и скорости инноваций.

Кадровая проблема — не только отток.

Внутри страны есть дефицит опытных исследователей уровня ведущих авторов, которым нужен международный обмен и публикации. Публикации идут, но международное влияние снижается из-за ограничения сотрудничества и доступа к конференциям. Это сдерживающий фактор для появления «новых архитектур» мирового класса.

Контрпродуктивная цензура и контроль интернета тоже мешают. Ограничения доступа к информации, блокировки, частые перебои связи в некоторых регионах снижают качество сотрудничества и скорость разработки. Это не кричащая проблема для всех, но она есть и бьёт по распределённым командам.

Безопасность и злоупотребления — отдельная строка расходов.

Российские нейросети активно используются в информационных операциях и пропаганде. Это не теория заговоров: западные институции российские сети связывают с системами ботов и дезинформации, а следы использования AI в подобных кампаниях документируются.

Контакт с международными инструментами — двойной.

С одной стороны, российские инженеры используют общедоступные библиотеки и идею трансформеров, репозитории Hugging Face и пр. С другой — прямой доступ к облачным сервисам иностранных компаний и специализированному железу ограничен. Это вынуждает к гибридным решениям: локальные кластера + публичные репозитории идей.

Про «эмбарго на научное сотрудничество» — да, оно есть и ослабляет обмен. Но часть академических и коммерческих связей всё ещё существует через нейтральные площадки, выставки и неформальные контакты. Это не как до 2022 года, но не полный разрыв.

Юридическая среда и регуляция развиваются. Властные структуры задают рамки: суверенный интернет, требования к данным, ограничения экспорта технологий. Это формирует спрос на локальные «соответствующие регуляциям» решения, но одновременно усложняет интеграцию с мировой экосистемой.

Инфраструктура данных — слабое место.

Для конкурентоспособных LLM нужно огромные, разнообразные и легально доступные датасеты. В России с этим сложнее: доступ к некоторым типам данных затруднён, а создание крупных, этических и лицензированных датасетов не так масштабно, как на западе. Это технически решаемо, но дорого и долго.

Примерные затраты времени и средств
на создание модели нейросети:

1. Исследования и разработка (R&D)

Сюда входит зарплата исследователей, инженеров, дата-сайентистов, менеджеров и юристов. У OpenAI и аналогичных компаний над моделью работают сотни людей.

Затраты: примерно 500 млн – 1 млрд $
Время: 1–2 года активной разработки, тестов и улучшений до выпуска

2. Сбор и очистка данных

Обучение требует сотен миллиардов токенов, тексты собираются из интернета, лицензируются или генерируются искусственно. Нужна фильтрация, разметка, проверка качества.

Затраты: 50–100 млн $
Время: от пары месяцев до года параллельно с исследованиями и разработкой.

3. Обучение модели

Это самое дорогое. По инсайдерским данным, GPT-4 стоило от 60 до 100 млн $ только на GPU-время. GPT-5 может быть на порядок дороже, т.к. нужны десятки тысяч топовых GPU (например NVIDIA H100 или A100).

Инфраструктура: кластер в 10–30 тыс. GPU
Стоимость аренды/закупки:
H100 стоит ~30–40 тыс. $ за штуку → 300 млн – 1 млрд $ только на «железо»
Если арендовать у Azure/AWS, будет ещё дороже.
Электроэнергия: одна H100 ≈ 700 Вт нагрузки
20 тыс. GPU × 0.7 кВт = 14 МВт
Тренировка может идти 2–3 месяца без остановки
Потребление ~1 ГВт·ч в месяц → около 3 ГВт·ч за цикл
Цена: 0.1 $/кВт·ч → 300 тыс. $ только электричество
(мелочь по сравнению с GPU)
Примерная стоимость обучения: 100 млн – 1.5 млрд $

4. Поддержка и обслуживание (инференс)

Инференс (от английского inference) — это стадия работы нейросети, когда она не учится, а отвечает на запросы пользователей.

После выпуска модель нужно «крутить» в продакшене. Тут расходы даже больше, чем на обучение, т.к. миллионы пользователей делают запросы ежедневно.

Кластеры: десятки тысяч GPU для обслуживания
Стоимость: от 500 млн. до 2 млрд. долларов в год
Электроэнергия: сотни мвт. потребляемой мощности

5. Итого

Исследования и подготовка: ~0.5–1 млрд $
Данные: ~0.1 млрд $
Обучение: 0.1–1.5 млрд $
Инфраструктура для продакшена: 0.5–2 млрд $/год

Суммарные затраты на запуск уровня GPT-5: примерно 1–3 млрд $

Поддержка ежегодно: ещё 1–2 млрд $

Время

Подготовка: 6–12 месяцев
Тренировка: 2–3 месяца (может быть несколько циклов)
Тесты и оптимизация: ещё 3–6 месяцев

Это как ответ на вопрос:

"Почему наши не могут сделать то же самое?"

Примечание автора: Да просто потому, что никто "из наших" не будет рисковать такими деньгами (да и нет их у них), поскольку отсутствует личная материальны заинтересованность, а, если и присутствует, то только "Как от такого пирога отщипнуть в личный карман".

Есть интересная миграция фокуса: от «великой универсальной модели» к «модели-решению» для конкретной отрасли. Это практично: меньше вычислений, быстрее отдача, проще монетизировать. Банки, ритейл, госсектор покупают решения, а не архитектуры. Это приносит деньги и образует индустрию, но не делает лидеров науки.

В ряде случаев компании действительно предпринимали попытки «показать результат любой ценой»: дообучение и упаковка чужих weights под локальную марку, амплификация результатов на внутренних тестах и сильный маркетинг. Жёсткие проверки извне часто выявляют такие практики.

Кибербезопасность и бэкдоры — скрытая угроза.

Исследования показывают усилия по подсадке вредоносных патчей в "open source" и попытки использовать открытые инструменты в атакующих сценариях. Это фактор риска для всей экосистемы разработки и доверия.

Образовательная база держится. Университеты всё ещё выпускают сильных инженеров и аналитиков. Проблема в том, что лучшие уезжают, а те, кто остаётся, часто уходит в коммерцию из-за зарплат и задач. Тем не менее, в вузах появляются курсы по ML и AI, и это даёт долгосрочную подпитку кадрами.

Финансирование идёт из двух каналов: частного и государственного. Частный сектор инвестирует в продукты и сервисы с прямой монетизацией. Государство направляет деньги в проекты, которые считаются стратегическими, иногда с упором на безопасность и контроль. Это формирует диссонанс между научной открытостью и прагматизмом.

Стартапы, которые ориентируются на экспорт и сотрудничество с Западом, страдают сильнее. Те, кто ориентирован на внутренний рынок или дружественные страны, находят возможности и клиентов. Это перераспределение рынков влияет на архитектуры и приоритеты разработки.

Наблюдается практическая конвергенция: компании, которые раньше занимались поиском и рекламою, переключились на коммерческие AI-решения. Это наблюдалось у Яндекса и других больших игроков — их бизнес-задачи диктуют развитие AI внутри экосистемы.

Международная репутация российских исследований пострадала. Даже качественные работы чаще воспринимаются под подозрением из-за геополитики и ограниченного участия в конференциях. Это тормозит прямое влияние российских идей на мировую научную повестку.

Технологии генерации контента в России активно используются в медиа и рекламе. Это приносит практическую пользу бизнесу, но также усиливает проблему "deepfake" и массового введения в заблуждение аудитории. Регулирование тут запаздывает.

Чтобы резюмировать без PR-шароваров:

Россия обладает интеллектом и инженерной культурой, которые позволяют делать серьёзные вещи в ML и AI. Но ей не хватает свободного доступа к вычислениям, к мировому сообществу и к некоторым компонентам цепочки поставок. Это делает рынок более прикладным и практичным, чем фундаментально революционным.

Из негатива:

Репак чужих моделей под своим брендом
Использование AI для пропаганды
Попытки вмешательства в "open source"
Проблемы с безопасностью

... всё это реальные и документированные западом явления. Параллельно идёт стройка локальных дата-центров и облачных сервисов, чтобы уменьшить зависимость от зарубежных, но испытывается дефицит нужной техники из-за санкций.

Из позитивов:

Внутренняя адаптация технологий даёт быстрые прикладные результаты, развивается рынок решений, появляются клиентоориентированные продукты, и в учебных заведениях всё ещё растут кадры. Это даёт устойчивую, пусть и ограниченную, экосистему.

Мой совет читателю: не верьте только внутренним пресс-релизам. Смотрите на независимые отчёты, на техническую документацию, на доступность инфраструктуры и на реальные кейсы внедрения у клиентов. Именно так формируется адекватная картина.

О лидерах Российского рынка в области нейросетей

Яндекс

Когда Яндекс только появился в конце 1990-х, интернет в России был совсем другим. Люди искали информацию буквально «наугад»: открывали по двадцать вкладок, проматывали страницы, возвращались назад и снова искали. Сайты были громоздкими, неудобными, с кучей рекламы и бессмысленного текста. И вот в этом хаосе появилась небольшая команда, которая решила:

«Надо сделать поиск, который реально понимает, что хочет человек».

И они сделали это.

Первые годы были экспериментальными. Ошибки были смешными: один из инженеров рассказывал, как вводил «погода в Москве», а система выдавала статьи про модные тенденции в Париже. Смех, исправления, долгие ночи за компьютером — так рождаются технологии.

Со временем Яндекс вырос в огромную экосистему. Почта, карты, облако, Алиса, видео, музыка, маркетплейс — всё это объединено в единую цифровую среду. Алиса стала отдельной «звездой». Люди шутят:

«Спросил у Алисы, как доехать на работу, а она предложила три маршрута, предупредила о пробках и сказала, что в кафе на пути новый сезон роллов».

Но у Яндекса есть ограничения. Санкции, дефицит оборудования и государственный контроль заставляют инженеров искать обходные пути. Мощные модели, которые раньше запускались без проблем, теперь приходится оптимизировать и тестировать на доступных серверах. Один разработчик сказал:

«Мы строим небоскрёб, но половину кирпичей нам не дают. И всё равно люди живут в нём».

YandexGPT встроен в поиск и Алису. Блогеры, студенты, предприниматели — каждый находит для себя что-то полезное. Можно просто попросить: «Сделай текст про путешествие в Петербург», и получить несколько вариантов. Для бизнеса это особенно важно: обработка писем, резюме, отзывов — экономия огромного времени.

Маркетинг любит говорить, что всё создано «с нуля», но на деле это комбинация собственных разработок и адаптации открытых технологий. Пользователям это неважно — главное, что инструмент работает.

Внутри России Яндекс востребован миллионами людей каждый день. Он понимает язык, культурные особенности, привычки пользователей — то, чего зарубежные аналоги часто не умеют.

Офис Яндекса живёт своей жизнью: сотрудники спорят о функциях, смеются над ошибками модели, обсуждают, как сделать поиск ещё умнее. Маленькие истории, случайные открытия, шутки — всё это делает технологии живыми. Один разработчик рассказывал:

«Когда мы тестируем новые функции, иногда удивляемся, что Алиса отвечает так, будто понимает нас лучше, чем коллеги».

Сбер

Сбербанк: банк, который стал технологическим холдингом

Сбер долгое время был обычным банком. Вклады, кредиты, отделения, очереди — всё стандартно. Потом кто-то сказал:

«А что если банк станет цифровой экосистемой?»

И это стало реальностью. Музыка, видео, маркетплейсы, мобильные приложения, гаджеты — финансовые услуги соседствуют с развлечениями и сервисами для бизнеса.

Особое место занимает искусственный интеллект. GigaChat — система, с которой можно общаться почти как с человеком. Предприниматель пишет: «Нужен текст для поста о скидках», а система предлагает несколько вариантов. Клиент спрашивает: «Как оформить кредит?» — и получает объяснение на понятном языке, с примерами.

Но не всё просто. Доступ к современному оборудованию ограничен, поэтому модели приходится оптимизировать. Тем не менее они реально помогают людям. Один пользователь написал:

«Я не знаю, как бы я справлялся без Сбера сейчас. Всё под рукой: деньги, советы, документы».

Для бизнеса это тоже работает: автоматизация, аналитика, генерация текстов — экономия времени и сил.

Маркетологи любят говорить, что всё придумано «с нуля», но на самом деле это в основном доработка того, что уже было. Приложение устроено удобно, почти на уровне «сама всё подскажет»: напомнит про платеж, подскажет, где можно сэкономить, иногда даже неожиданно уведомит о бонусах — и ты думаешь: «А, точно, я забыл про это». Пользователи ощущают, что банк думает о них.

В офисах Сбера сотрудники обсуждают: «Как сделать ИИ ещё полезнее для людей?» Иногда спорят, иногда смеются: «GigaChat опять предложил странный вариант текста, но клиенту понравилось». Эти живые истории делают систему человечной.

Один менеджер рассказывал, как клиент спрашивал:

«Можно ли мне сэкономить на коммуналке через приложение?»

И ему буквально через минуту предложили оптимальные варианты, которые реально сработали. Именно такие ситуации показывают, что технологии работают для людей, а не просто для отчётов и презентаций.

От автора:

Вот, примерно так и представляют за рубежом наше положение с развитием отечественных нейросетей. Понятно, что многое почерпнуто из интернет-прессы, т.е. от того, что компании сами и себе пишут в сети (следствие PR), но, тем не менее, я не особо заметил негатива по отношению в нашей стране в высказываниях и мнениях зарубежных специалистов.

P.S.