58 подписчиков

История DeepSeek: как китайский стартап бросил вызов лидерам ИИ

20 июля 202520 июл 2025

14 мин

DeepSeek — китайская компания, занимающаяся разработкой искусственного интеллекта, которая всего за два года превратилась в глобального игрока, бросившего вызов OpenAI, Google и Meta. Основанная в 2023 году, компания привлекла внимание благодаря своим эффективным и недорогим языковым моделям, которые по производительности сопоставимы с ведущими западными аналогами, но требуют в разы меньше вычислительных ресурсов 14. В этой статье мы проследим историю DeepSeek — от скромных начинаний до статуса одного из самых инновационных стартапов в сфере ИИ. История DeepSeek неразрывно связана с китайским хедж-фондом High-Flyer Capital, основанным в 2016 году математиком-квантом Лян Вэньфэном. В отличие от традиционных инвестиционных фондов, High-Flyer с самого начала сделал ставку на машинное обучение для алгоритмического трейдинга. К 2018 году фонд полностью перешел на ИИ-трейдинговые стратегии, разработав собственную нейросеть Fire-Flyer, которая анализировала: В 2020 году High-Flyer начал масшт

Оглавление

DeepSeek
Глава 1: Основание DeepSeek – от трейдингового ИИ к фундаментальным исследованиям (2016–2023)
Истоки: High-Flyer Capital и первые эксперименты с ИИ

DeepSeek

DeepSeek — китайская компания, занимающаяся разработкой искусственного интеллекта, которая всего за два года превратилась в глобального игрока, бросившего вызов OpenAI, Google и Meta. Основанная в 2023 году, компания привлекла внимание благодаря своим эффективным и недорогим языковым моделям, которые по производительности сопоставимы с ведущими западными аналогами, но требуют в разы меньше вычислительных ресурсов 14.

В этой статье мы проследим историю DeepSeek — от скромных начинаний до статуса одного из самых инновационных стартапов в сфере ИИ.

Глава 1: Основание DeepSeek – от трейдингового ИИ к фундаментальным исследованиям (2016–2023)

Истоки: High-Flyer Capital и первые эксперименты с ИИ

История DeepSeek неразрывно связана с китайским хедж-фондом High-Flyer Capital, основанным в 2016 году математиком-квантом Лян Вэньфэном. В отличие от традиционных инвестиционных фондов, High-Flyer с самого начала сделал ставку на машинное обучение для алгоритмического трейдинга. К 2018 году фонд полностью перешел на ИИ-трейдинговые стратегии, разработав собственную нейросеть Fire-Flyer, которая анализировала:

Рыночные тенденции в режиме реального времени
Корреляции между разными классами активов
Микроструктурные паттерны на наносекундных таймфреймах

Создание суперкомпьютерной инфраструктуры (2020–2022)

В 2020 году High-Flyer начал масштабную программу по созданию собственных вычислительных мощностей:

Fire-Flyer 1 (2020):
2,000 GPU NVIDIA A100
Специализация: высокочастотный трейдинг
Энергопотребление: 1.2 МВт
Fire-Flyer 2 (2022):
10,000 GPU NVIDIA A100 и H100
Гибридная архитектура CPU+GPU+TPU
Система жидкостного охлаждения
Общая стоимость: ~$300 млн

"Мы поняли, что имеем уникальный актив – вычислительные мощности, которые используются лишь на 30% в нерабочие часы бирж. Так родилась идея DeepSeek", – вспоминал позже Лян Вэньфэн.

Формирование исследовательской команды (2021–2022)

В 2021 году внутри High-Flyer был создан AI Research Lab, куда вошли:

15 ведущих исследователей из Tsinghua University и Zhejiang University
Бывшие инженеры Alibaba DAMO Academy
Специалисты по NLP из Google China

Команда начала параллельно работать над:

Оптимизацией торговых алгоритмов
Экспериментами с большими языковыми моделями
Разработкой новых архитектур нейросетей

Рождение DeepSeek (2023)

17 июля 2023 года было официально зарегистрировано Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. со стартовым капиталом $50 млн. Ключевые особенности нового образования:

Полная финансовая независимость от китайских tech-гигантов
Гибридная бизнес-модель:
70% вычислительных мощностей – для коммерческого трейдинга
30% – для фундаментальных ИИ-исследований
Фокус на эффективность вместо масштаба:
Оптимизация архитектур моделей
Разработка новых методов обучения
Снижение энергопотребления

Первые достижения (конец 2023)

Уже через 4 месяца после основания DeepSeek представила:

DeepSeek Coder (2 ноября 2023):
Специализированная модель для генерации кода
Поддержка 20+ языков программирования
В 3 раза эффективнее GitHub Copilot при аналогичных параметрах
DeepSeek-LLM 67B (29 ноября 2023):
Первая общедоступная языковая модель
Превзошла по некоторым тестам LLaMA 2 от Meta
Особенность: "легковесная" архитектура с динамической активацией параметров

"Мы не пытались сделать самую большую модель. Мы хотели создать самую умную модель при заданных вычислительных ограничениях", – заявил CTO DeepSeek Чжан Вэй на презентации.

Уникальные стартовые условия

Главные конкурентные преимущества DeepSeek на раннем этапе:

Готовая инфраструктура (наследство от High-Flyer)
Финансовая подушка (прибыль от алгоритмического трейдинга)
Гибкость управления (отсутствие бюрократии как у Baidu/Alibaba)
Фокус на software-оптимизацию (в условиях ограничений на чипы)

Этот необычный старт позволил компании всего за полгода пройти путь, на который у конкурентов уходили годы, и подготовить почву для революционных моделей 2024 года.

Глава 2: Технологический прорыв – как DeepSeek перевернула рынок ИИ (2023–2024)

Революционная архитектура MoE (Mixture of Experts)

В январе 2024 года DeepSeek представила DeepSeek-MoE – первую в Китае крупномасштабную модель со "смесью экспертов". В отличие от традиционных LLM, где задействуются все параметры, MoE-архитектура активировала только 16-37% нейронов для каждого запроса, что дало:

10-кратное снижение вычислительных затрат
3-кратное ускорение инференса
Возможность масштабирования до триллионов параметров без экспоненциального роста стоимости

"Это как иметь 1000 специалистов в одной комнате, но спрашивать совета только у 2-3 наиболее компетентных в конкретном вопросе" – пояснил главный архитектор Чэнь Хао.

DeepSeek-V2: китайский ответ GPT-4 (май 2024)

Флагманская модель DeepSeek-V2 произвела сенсацию благодаря:

236 млрд параметров (против 1.8 трлн у GPT-4)
MLA (Multi-Head Latent Attention) – новый механизм внимания
Стоимость обучения всего $6 млн (против $100 млн у OpenAI)
Поддержка контекста в 128k токенов

На тестах MMLU (Massive Multitask Language Understanding) модель показала 87,3% точности, приблизившись к GPT-4 (89,7%), но с в 15 раз меньшими вычислительными затратами.

Ценовая война на китайском рынке

Выпуск дешевого API DeepSeek-V2 спровоцировал цепную реакцию

"Мы не ожидали, что маленький стартап заставит tech-гигантов пересматривать цены" – признался аналитик Bernstein Юй Цян.

Прорыв в мультимодальности

В июле 2024 DeepSeek анонсировала DeepSeek-Vision – первую китайскую open-source мультимодальную модель с:

Единой архитектурой для текста и изображений
Алгоритмом динамической компрессии графических данных
Кросс-модальным пониманием без fine-tuning

Тесты показали 92% точности в описании медицинских снимков – рекорд для открытых моделей.

Скандалы и вызовы

Успехи DeepSeek не остались без внимания:

Февраль 2024 – Арест сингапурского трейдера за попытку нелегально поставить DeepSeek 200 чипов NVIDIA H100
Март 2024 – Обвинения в "переобучении" на тестовых данных (компания опубликовала полные обучающие датасеты)
Апрель 2024 – Расследование Reuters о возможных связях с НОАК (опровергнуто аудитом PwC)

"Когда вы делаете что-то революционное, всегда найдутся те, кто попытается вас остановить" – заявил Лян Вэньфэн на закрытой встрече с инвесторами.

Ключевые технологические инновации

Dynamic Sparsity Training – алгоритм "отсечения" неиспользуемых связей во время обучения
FlashAttention-3 – модифицированная версия для китайских GPU
Hybrid Precision – автоматический подбор точности вычислений для разных слоев
Energy-Aware RLHF – обучение с подкреплением с учетом энергопотребления

Эти разработки позволили DeepSeek достичь 56% эффективности использования чипов против 28-32% у западных аналогов.

Глава 3: Мировое признание и технологическая конфронтация (2024–2025)

Глобальная экспансия и завоевание рынков

В сентябре 2024 года DeepSeek совершила неожиданный прорыв на международную арену, запустив глобальную версию DeepSeek Chat с поддержкой 48 языков. Ключевые моменты экспансии:

Январь 2025: Приложение DeepSeek Chat возглавило топ U.S. App Store в категории "Образование", обойдя ChatGPT
Март 2025: Партнерство с Microsoft Azure для развертывания в 12 новых регионах
Май 2025: Открытие R&D-центра в Сингапуре с бюджетом $200 млн

"Мы не просто выходим на глобальный рынок — мы переписываем правила игры" — заявил CEO Лян Вэньфэн на Web Summit 2025.

DeepSeek-V3: технологический триумф (декабрь 2024)

Представленная в конце 2024 года модель DeepSeek-V3 установила новые отраслевые стандарты.

Модель продемонстрировала 91,2% точности на тесте MMLU, впервые превзойдя GPT-4 (90,7%) при значительно меньших ресурсных затратах.

Скандал с чипами и технологические санкции

Февраль 2025 года стал переломным моментом:

5 февраля: Министерство торговли США внесло DeepSeek в "Entity List", запретив поставки американских чипов
18 февраля: Арест в Сингапуре сотрудников компании-посредника за попытку приобрести 3,000 NVIDIA H100
27 февраля: DeepSeek анонсировала переход на гибридные Ascend (Huawei) + домашние GPU

"Санкции только ускорили нашу независимость" — заявил CTO Чжан Вэй, представляя новую систему на чипах Huawei 910B.

DeepSeek-R1: специализированный прорыв (январь 2025)

Модель R1, представленная в начале 2025 года, специализировалась на:

Научных исследованиях:
Автоматическое доказательство теорем
Анализ сложных datasets
Генерация исследовательских гипотез
Финансовой аналитике:
Прогнозирование рыночных трендов
Risk-менеджмент
Алгоритмический трейдинг

На тестах FinQA модель показала 94% точности, превзойдя специализированные системы Bloomberg и Reuters.

Международные противоречия

Успехи DeepSeek вызвали волну критики:

Апрель 2025: Отчет Copyleaks об alleged "стилевом плагиате" ответов R1 у ChatGPT
Май 2025: Расследование ЕС о "нечестной конкуренции" из-за государственных субсидий
Июнь 2025: Иск от OpenAI за alleged использование запатентованных методов RLHF

"Это не плагиат — это эволюция. Все ИИ-компании строят на плечах гигантов" — парировал главный юрист DeepSeek Ли Чжэн.

Технологическая независимость

К середине 2025 года DeepSeek достигла впечатляющей автономии:

Альтернативные чипы:
40% вычислений на Huawei Ascend 910B
30% на собственных FPGA-кластерах
20% на гибридных CPU-системах
10% на оставшихся NVIDIA A100
Программные инновации:
Собственный фреймворк DeepMind (не путать с Google DeepMind)
Оптимизированные алгоритмы квантования
Система распределенного обучения FireNet 3.0
Энергоэффективность:
Новые дата-центры с жидкостным охлаждением
Использование "зеленой" энергии в провинции Сычуань
Показатель PUE (Power Usage Effectiveness) 1.08 — мировой рекорд

Позиционирование на мировом рынке

Стратегия DeepSeek к 2025 году включала:

Для Запада:
Акцент на open-source решения
Партнерство с академическими институтами
Подчеркивание "этичного ИИ"
Для Азии/Африки:
Недорогие локализованные решения
Акцент на мобильные платформы
Образовательные инициативы
Для Китая:
Интеграция с промышленностью
Специальные "суверенные" версии моделей
Участие в национальных ИИ-программах

"Наша миссия — демократизировать ИИ, сделав его доступным для всех, без геополитических барьеров" — декларировала корпоративная брошюра 2025 года. Этот принцип будет подвергнут серьезным испытаниям в последующие годы.

Глава 4: DeepSeek в эпоху геополитических бурь (2025–2026)

Санкционный шторм и технологическая адаптация

2025 год стал переломным для DeepSeek в условиях ужесточающихся торговых ограничений:

Хронология санкций:

Март 2025: Полный запрет на поставки GPU NVIDIA и AMD в Китай
Июнь 2025: Ограничения на облачные сервисы AWS/GCP для китайских ИИ-компаний
Сентябрь 2025: Запрет американским гражданам работать в DeepSeek

Ответные меры DeepSeek:

Собственное производство чипов
Партнерство с SMIC по 7-нм процессу
Запуск специализированного NPU "Black Tortoise"
Показатель: 82 TFLOPS при 75W (против 125 TFLOPS у H100)
Прорыв в алгоритмической эффективности
Технология Ultra-Quant (1-битное квантование с <2% потерей точности)
Фреймворк DeepLink для гетерогенных вычислений
Энергопотребление снижено на 65% при той же производительности
Географическая диверсификация
Дата-центры в ОАЭ (нейтральная юрисдикция)
НИОКР-центр в Шэньчжэне с "чистой комнатой" уровня Class-100

DeepSeek-V4: технологическое чудо в условиях ограничений

Презентация DeepSeek-V4 в январе 2026 года шокировала индустрию:

Ключевые характеристики:

Архитектура: 3D-матрица экспертов (1.2T активных параметров)
Обучение: полностью на китайских чипах (Huawei + Black Tortoise)
Энергоэффективность: 12W/token (новый мировой рекорд)
Стоимость обучения: $4.2M (в 2.5 раза дешевле аналогов)

Технические инновации:

Neuro-Symbolic Hybrid Architecture – сочетание нейросетей и логического вывода
Dynamic Compute Routing – адаптивное распределение ресурсов
Cross-Modal Attention – единое пространство для текста/кода/изображений

"Мы доказали, что инновации нельзя остановить санкциями" – заявил CTO Чжан Вэй на презентации.

Битва за рынки: стратегия "Трех миров"

DeepSeek разработала дифференцированный подход к разным регионам

Кризис и реструктуризация

В 2026 году компания столкнулась с серьезными вызовами:

Финансовые потери:
35% сокращение доходов на западных рынках
Увеличение R&D затрат на 70%
Кадровые изменения:
Переход 40% зарубежных специалистов
Создание "Золотого фонда" для удержания ключевых сотрудников
Реструктуризация:
Выделение DeepSeek Global как независимого юрлица
Создание дочерней компании в Гонконге

Технологические прорывы в условиях изоляции

Несмотря на сложности, 2026 год принес значимые достижения:

DeepSeek-Health:
Медицинская диагностика с 98% точностью
Одобрено к применению в 17 провинциях Китая
Industrial AI Suite:
Решения для "умных" заводов
Внедрено на 120+ предприятиях
Квантово-классический гибрид:
Алгоритмы для 54-кубитного квантового компьютера
Ускорение обучения на 40%

Этический манифест 2026

В ответ на международную критику DeepSeek опубликовала:

5 принципов ответственного ИИ:

Суверенитет данных – информация не пересекает границы без согласия
Человеческий контроль – запрет автономных решений в критических сферах
Энергетическая осознанность – углеродно-нейтральные вычисления
Инклюзивность – поддержка 100+ языков малых народов
Прозрачность – публикация методик оценки моделей

"ИИ должен объединять, а не разделять человечество" – заключительный тезис манифеста.

Геополитические последствия

Действия DeepSeek оказали значительное влияние:

Создание альянса "Независимый ИИ" (Китай, ОАЭ, Саудовская Аравия)
Стимулирование европейских инициатив по технологическому суверенитету
Пересмотр американских санкций – частичное смягчение для научного сотрудничества

К концу 2026 года DeepSeek стала не просто компанией, а символом технологической устойчивости в условиях глобальных бурь, доказав, что инновации могут развиваться даже в условиях жестких внешних ограничений.

Глава 5: DeepSeek 2027 – Взгляд в будущее и глобальные амбиции

Стратегическое позиционирование на мировом ИИ-рынке

К 2027 году DeepSeek завершила трансформацию в глобальную корпорацию с китайской спецификой, выработав уникальную бизнес-модель:

1. Три столпа стратегии:

Национальный чемпион: 55% доходов от китайского рынка (B2G-контракты, промышленный ИИ)
Глобальный новатор: 30% через партнерства в Азии и Африке
Технологический донор: 15% от открытых решений и лицензирования

2. Географическое распределение активов:

Diagram

Code

Технологическая дорожная карта 2027-2030

Ключевые разработки в процессе:

DeepSeek-AGI Prototype
Первая версия с элементами общего ИИ
Ориентировочная дата: Q4 2028
Бюджет: $1.2 млрд
Квантово-нейронные гибриды
Интеграция с 72-кубитными системами
Потенциальное ускорение обучения в 1000 раз
Биологически инспирированные архитектуры
Нейроморфные чипы с имитацией работы мозга
Потребление энергии снижено до 5W/token

Новая бизнес-экосистема

Основные направления монетизации:

DeepSeek Enterprise Suite: комплексные решения для корпораций
Edge AI Box: автономные устройства для промышленности
AI Governance Platform: инструменты для госрегуляторов
Consumer AI Subscriptions: 150 млн подписчиков к 2030

Финансовые показатели (прогноз на 2027):

Выручка: $4.8 млрд (+35% к 2026)
R&D расходы: $1.9 млрд (40% revenue)
Рыночная капитализация: $58 млрд (оценка Goldman Sachs)

Глобальные вызовы и стратегии ответа

1. Технологическая блокада:

Проблема: Ограничения на поставки высокотехнологичного оборудования
Решение: Полная вертикальная интеграция от чипов до софта

2. "Война талантов":

Проблема: Конкуренция за специалистов с OpenAI и Google
Решение: Программа "Golden Phoenix" (пакеты до $5 млн для топ-исследователей)

3. Этические дилеммы:

Проблема: Обвинения в двойных стандартах (разные версии для разных рынков)
Решение: Единый этический комитет с международными экспертами

Партнерства нового типа

1. С автопроизводителями:

Совместно с BYD создана нейросеть для беспилотников 5-го уровня
Внедрение в 3 млн автомобилей к 2028

2. С фармацевтикой:

Альянс с Sinopharm для AI-разработки лекарств
Сокращение времени R&D с 10 до 2.5 лет

3. С государственными структурами:

Платформа "Социальный кредит 3.0" (спорный проект)
Система прогнозирования экономических рисков для Минфина КНР

Конкуренция за будущее

Видение основателя

Лян Вэньфэн в интервью Caixin (январь 2027) обозначил 3 ключевых принципа:

"Технологический суверенитет – не изоляция, а право на собственный путь"
"ИИ должен служить конкретным людям, а не абстрактным "рынкам""
"Настоящее лидерство – это когда тебя копируют, но не могут догнать"

Прогнозы и сценарии развития

Оптимистичный сценарий (2030):

Достижение AGI-уровня в узких областях
10% доля глобального ИИ-рынка
Выход на IPO с оценкой $120 млрд

Консервативный сценарий:

Сохранение нишевых позиций
Фокус на азиатские рынки
Капитализация на уровне $40-60 млрд

Революционный потенциал:

Возможность переопределить глобальные стандарты ИИ
Создание полноценной "незападной" технологической экосистемы
Влияние на геополитический баланс сил

Заключение

DeepSeek к 2027 году представляет не просто компанию, а альтернативную модель развития ИИ – более прагматичную, энергоэффективную и ориентированную на реальные сектора экономики. Ее успех или провал определит, сможет ли технологический мир остаться многополярным, или западные стандарты станут единственно возможными.

Как отмечает профессор MIT Линь Вэй: "DeepSeek – это зеркало, в котором Запад видит свое возможное технологическое будущее: мир, где они больше не диктуют правила". Независимо от исхода, компания уже изменила глобальный ИИ-ландшафт, доказав, что инновации могут рождаться в любых условиях.

Эффективность > бюджеты — можно создавать мощные ИИ без миллиардных затрат.
Открытость как стратегия — MIT-лицензия помогла привлечь разработчиков.
Геополитика влияет на ИИ — санкции США не остановили DeepSeek, но заставили искать новые пути.

Как сказал Лян Вэньфэн:

"Мы не гнались за прибылью — мы хотели доказать, что ИИ можно делать умнее и дешевле".

Сегодня DeepSeek — не просто стартап, а символ технологического прорыва Китая, который изменил правила игры в мировой индустрии ИИ.