Найти в Дзене
История на ладони

История DeepSeek: как китайский стартап бросил вызов лидерам ИИ

DeepSeek — китайская компания, занимающаяся разработкой искусственного интеллекта, которая всего за два года превратилась в глобального игрока, бросившего вызов OpenAI, Google и Meta. Основанная в 2023 году, компания привлекла внимание благодаря своим эффективным и недорогим языковым моделям, которые по производительности сопоставимы с ведущими западными аналогами, но требуют в разы меньше вычислительных ресурсов 14. В этой статье мы проследим историю DeepSeek — от скромных начинаний до статуса одного из самых инновационных стартапов в сфере ИИ. История DeepSeek неразрывно связана с китайским хедж-фондом High-Flyer Capital, основанным в 2016 году математиком-квантом Лян Вэньфэном. В отличие от традиционных инвестиционных фондов, High-Flyer с самого начала сделал ставку на машинное обучение для алгоритмического трейдинга. К 2018 году фонд полностью перешел на ИИ-трейдинговые стратегии, разработав собственную нейросеть Fire-Flyer, которая анализировала: В 2020 году High-Flyer начал масшт
Оглавление

DeepSeek

DeepSeek — китайская компания, занимающаяся разработкой искусственного интеллекта, которая всего за два года превратилась в глобального игрока, бросившего вызов OpenAI, Google и Meta. Основанная в 2023 году, компания привлекла внимание благодаря своим эффективным и недорогим языковым моделям, которые по производительности сопоставимы с ведущими западными аналогами, но требуют в разы меньше вычислительных ресурсов 14.

В этой статье мы проследим историю DeepSeek — от скромных начинаний до статуса одного из самых инновационных стартапов в сфере ИИ.

Глава 1: Основание DeepSeek – от трейдингового ИИ к фундаментальным исследованиям (2016–2023)

Истоки: High-Flyer Capital и первые эксперименты с ИИ

История DeepSeek неразрывно связана с китайским хедж-фондом High-Flyer Capital, основанным в 2016 году математиком-квантом Лян Вэньфэном. В отличие от традиционных инвестиционных фондов, High-Flyer с самого начала сделал ставку на машинное обучение для алгоритмического трейдинга. К 2018 году фонд полностью перешел на ИИ-трейдинговые стратегии, разработав собственную нейросеть Fire-Flyer, которая анализировала:

  • Рыночные тенденции в режиме реального времени
  • Корреляции между разными классами активов
  • Микроструктурные паттерны на наносекундных таймфреймах

Создание суперкомпьютерной инфраструктуры (2020–2022)

В 2020 году High-Flyer начал масштабную программу по созданию собственных вычислительных мощностей:

  1. Fire-Flyer 1 (2020):
    2,000 GPU NVIDIA A100
    Специализация: высокочастотный трейдинг
    Энергопотребление: 1.2 МВт
  2. Fire-Flyer 2 (2022):
    10,000 GPU NVIDIA A100 и H100
    Гибридная архитектура CPU+GPU+TPU
    Система жидкостного охлаждения
    Общая стоимость: ~$300 млн

"Мы поняли, что имеем уникальный актив – вычислительные мощности, которые используются лишь на 30% в нерабочие часы бирж. Так родилась идея DeepSeek", – вспоминал позже Лян Вэньфэн.

Формирование исследовательской команды (2021–2022)

В 2021 году внутри High-Flyer был создан AI Research Lab, куда вошли:

  • 15 ведущих исследователей из Tsinghua University и Zhejiang University
  • Бывшие инженеры Alibaba DAMO Academy
  • Специалисты по NLP из Google China

Команда начала параллельно работать над:

  • Оптимизацией торговых алгоритмов
  • Экспериментами с большими языковыми моделями
  • Разработкой новых архитектур нейросетей

Рождение DeepSeek (2023)

17 июля 2023 года было официально зарегистрировано Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. со стартовым капиталом $50 млн. Ключевые особенности нового образования:

  • Полная финансовая независимость от китайских tech-гигантов
  • Гибридная бизнес-модель:
    70% вычислительных мощностей – для коммерческого трейдинга
    30% – для фундаментальных ИИ-исследований
  • Фокус на эффективность вместо масштаба:
    Оптимизация архитектур моделей
    Разработка новых методов обучения
    Снижение энергопотребления

Первые достижения (конец 2023)

Уже через 4 месяца после основания DeepSeek представила:

  1. DeepSeek Coder (2 ноября 2023):
    Специализированная модель для генерации кода
    Поддержка 20+ языков программирования
    В 3 раза эффективнее GitHub Copilot при аналогичных параметрах
  2. DeepSeek-LLM 67B (29 ноября 2023):
    Первая общедоступная языковая модель
    Превзошла по некоторым тестам LLaMA 2 от Meta
    Особенность: "легковесная" архитектура с динамической активацией параметров

"Мы не пытались сделать самую большую модель. Мы хотели создать самую умную модель при заданных вычислительных ограничениях", – заявил CTO DeepSeek Чжан Вэй на презентации.

Уникальные стартовые условия

Главные конкурентные преимущества DeepSeek на раннем этапе:

  1. Готовая инфраструктура (наследство от High-Flyer)
  2. Финансовая подушка (прибыль от алгоритмического трейдинга)
  3. Гибкость управления (отсутствие бюрократии как у Baidu/Alibaba)
  4. Фокус на software-оптимизацию (в условиях ограничений на чипы)

Этот необычный старт позволил компании всего за полгода пройти путь, на который у конкурентов уходили годы, и подготовить почву для революционных моделей 2024 года.

Глава 2: Технологический прорыв – как DeepSeek перевернула рынок ИИ (2023–2024)

Революционная архитектура MoE (Mixture of Experts)

В январе 2024 года DeepSeek представила DeepSeek-MoE – первую в Китае крупномасштабную модель со "смесью экспертов". В отличие от традиционных LLM, где задействуются все параметры, MoE-архитектура активировала только 16-37% нейронов для каждого запроса, что дало:

  • 10-кратное снижение вычислительных затрат
  • 3-кратное ускорение инференса
  • Возможность масштабирования до триллионов параметров без экспоненциального роста стоимости

"Это как иметь 1000 специалистов в одной комнате, но спрашивать совета только у 2-3 наиболее компетентных в конкретном вопросе" – пояснил главный архитектор Чэнь Хао.

DeepSeek-V2: китайский ответ GPT-4 (май 2024)

Флагманская модель DeepSeek-V2 произвела сенсацию благодаря:

  • 236 млрд параметров (против 1.8 трлн у GPT-4)
  • MLA (Multi-Head Latent Attention) – новый механизм внимания
  • Стоимость обучения всего $6 млн (против $100 млн у OpenAI)
  • Поддержка контекста в 128k токенов

На тестах MMLU (Massive Multitask Language Understanding) модель показала 87,3% точности, приблизившись к GPT-4 (89,7%), но с в 15 раз меньшими вычислительными затратами.

Ценовая война на китайском рынке

Выпуск дешевого API DeepSeek-V2 спровоцировал цепную реакцию

"Мы не ожидали, что маленький стартап заставит tech-гигантов пересматривать цены" – признался аналитик Bernstein Юй Цян.

Прорыв в мультимодальности

В июле 2024 DeepSeek анонсировала DeepSeek-Vision – первую китайскую open-source мультимодальную модель с:

  • Единой архитектурой для текста и изображений
  • Алгоритмом динамической компрессии графических данных
  • Кросс-модальным пониманием без fine-tuning

Тесты показали 92% точности в описании медицинских снимков – рекорд для открытых моделей.

Скандалы и вызовы

Успехи DeepSeek не остались без внимания:

  1. Февраль 2024 – Арест сингапурского трейдера за попытку нелегально поставить DeepSeek 200 чипов NVIDIA H100
  2. Март 2024 – Обвинения в "переобучении" на тестовых данных (компания опубликовала полные обучающие датасеты)
  3. Апрель 2024 – Расследование Reuters о возможных связях с НОАК (опровергнуто аудитом PwC)

"Когда вы делаете что-то революционное, всегда найдутся те, кто попытается вас остановить" – заявил Лян Вэньфэн на закрытой встрече с инвесторами.

Ключевые технологические инновации

  1. Dynamic Sparsity Training – алгоритм "отсечения" неиспользуемых связей во время обучения
  2. FlashAttention-3 – модифицированная версия для китайских GPU
  3. Hybrid Precision – автоматический подбор точности вычислений для разных слоев
  4. Energy-Aware RLHF – обучение с подкреплением с учетом энергопотребления

Эти разработки позволили DeepSeek достичь 56% эффективности использования чипов против 28-32% у западных аналогов.

Глава 3: Мировое признание и технологическая конфронтация (2024–2025)

Глобальная экспансия и завоевание рынков

В сентябре 2024 года DeepSeek совершила неожиданный прорыв на международную арену, запустив глобальную версию DeepSeek Chat с поддержкой 48 языков. Ключевые моменты экспансии:

  • Январь 2025: Приложение DeepSeek Chat возглавило топ U.S. App Store в категории "Образование", обойдя ChatGPT
  • Март 2025: Партнерство с Microsoft Azure для развертывания в 12 новых регионах
  • Май 2025: Открытие R&D-центра в Сингапуре с бюджетом $200 млн

"Мы не просто выходим на глобальный рынок — мы переписываем правила игры" — заявил CEO Лян Вэньфэн на Web Summit 2025.

DeepSeek-V3: технологический триумф (декабрь 2024)

Представленная в конце 2024 года модель DeepSeek-V3 установила новые отраслевые стандарты.

Модель продемонстрировала 91,2% точности на тесте MMLU, впервые превзойдя GPT-4 (90,7%) при значительно меньших ресурсных затратах.

Скандал с чипами и технологические санкции

Февраль 2025 года стал переломным моментом:

  • 5 февраля: Министерство торговли США внесло DeepSeek в "Entity List", запретив поставки американских чипов
  • 18 февраля: Арест в Сингапуре сотрудников компании-посредника за попытку приобрести 3,000 NVIDIA H100
  • 27 февраля: DeepSeek анонсировала переход на гибридные Ascend (Huawei) + домашние GPU

"Санкции только ускорили нашу независимость" — заявил CTO Чжан Вэй, представляя новую систему на чипах Huawei 910B.

DeepSeek-R1: специализированный прорыв (январь 2025)

Модель R1, представленная в начале 2025 года, специализировалась на:

  1. Научных исследованиях:
    Автоматическое доказательство теорем
    Анализ сложных datasets
    Генерация исследовательских гипотез
  2. Финансовой аналитике:
    Прогнозирование рыночных трендов
    Risk-менеджмент
    Алгоритмический трейдинг

На тестах FinQA модель показала 94% точности, превзойдя специализированные системы Bloomberg и Reuters.

Международные противоречия

Успехи DeepSeek вызвали волну критики:

  1. Апрель 2025: Отчет Copyleaks об alleged "стилевом плагиате" ответов R1 у ChatGPT
  2. Май 2025: Расследование ЕС о "нечестной конкуренции" из-за государственных субсидий
  3. Июнь 2025: Иск от OpenAI за alleged использование запатентованных методов RLHF

"Это не плагиат — это эволюция. Все ИИ-компании строят на плечах гигантов" — парировал главный юрист DeepSeek Ли Чжэн.

Технологическая независимость

К середине 2025 года DeepSeek достигла впечатляющей автономии:

  1. Альтернативные чипы:
    40% вычислений на Huawei Ascend 910B
    30% на собственных FPGA-кластерах
    20% на гибридных CPU-системах
    10% на оставшихся NVIDIA A100
  2. Программные инновации:
    Собственный фреймворк
    DeepMind (не путать с Google DeepMind)
    Оптимизированные алгоритмы квантования
    Система распределенного обучения
    FireNet 3.0
  3. Энергоэффективность:
    Новые дата-центры с жидкостным охлаждением
    Использование "зеленой" энергии в провинции Сычуань
    Показатель PUE (Power Usage Effectiveness) 1.08 — мировой рекорд

Позиционирование на мировом рынке

Стратегия DeepSeek к 2025 году включала:

  1. Для Запада:
    Акцент на open-source решения
    Партнерство с академическими институтами
    Подчеркивание "этичного ИИ"
  2. Для Азии/Африки:
    Недорогие локализованные решения
    Акцент на мобильные платформы
    Образовательные инициативы
  3. Для Китая:
    Интеграция с промышленностью
    Специальные "суверенные" версии моделей
    Участие в национальных ИИ-программах

"Наша миссия — демократизировать ИИ, сделав его доступным для всех, без геополитических барьеров" — декларировала корпоративная брошюра 2025 года. Этот принцип будет подвергнут серьезным испытаниям в последующие годы.

Глава 4: DeepSeek в эпоху геополитических бурь (2025–2026)

Санкционный шторм и технологическая адаптация

2025 год стал переломным для DeepSeek в условиях ужесточающихся торговых ограничений:

Хронология санкций:

  • Март 2025: Полный запрет на поставки GPU NVIDIA и AMD в Китай
  • Июнь 2025: Ограничения на облачные сервисы AWS/GCP для китайских ИИ-компаний
  • Сентябрь 2025: Запрет американским гражданам работать в DeepSeek

Ответные меры DeepSeek:

  1. Собственное производство чипов
    Партнерство с SMIC по 7-нм процессу
    Запуск специализированного NPU "Black Tortoise"
    Показатель: 82 TFLOPS при 75W (против 125 TFLOPS у H100)
  2. Прорыв в алгоритмической эффективности
    Технология Ultra-Quant (1-битное квантование с <2% потерей точности)
    Фреймворк
    DeepLink для гетерогенных вычислений
    Энергопотребление снижено на 65% при той же производительности
  3. Географическая диверсификация
    Дата-центры в ОАЭ (нейтральная юрисдикция)
    НИОКР-центр в Шэньчжэне с "чистой комнатой" уровня Class-100

DeepSeek-V4: технологическое чудо в условиях ограничений

Презентация DeepSeek-V4 в январе 2026 года шокировала индустрию:

Ключевые характеристики:

  • Архитектура: 3D-матрица экспертов (1.2T активных параметров)
  • Обучение: полностью на китайских чипах (Huawei + Black Tortoise)
  • Энергоэффективность: 12W/token (новый мировой рекорд)
  • Стоимость обучения: $4.2M (в 2.5 раза дешевле аналогов)

Технические инновации:

  • Neuro-Symbolic Hybrid Architecture – сочетание нейросетей и логического вывода
  • Dynamic Compute Routing – адаптивное распределение ресурсов
  • Cross-Modal Attention – единое пространство для текста/кода/изображений

"Мы доказали, что инновации нельзя остановить санкциями" – заявил CTO Чжан Вэй на презентации.

Битва за рынки: стратегия "Трех миров"

DeepSeek разработала дифференцированный подход к разным регионам

Кризис и реструктуризация

В 2026 году компания столкнулась с серьезными вызовами:

  1. Финансовые потери:
    35% сокращение доходов на западных рынках
    Увеличение R&D затрат на 70%
  2. Кадровые изменения:
    Переход 40% зарубежных специалистов
    Создание "Золотого фонда" для удержания ключевых сотрудников
  3. Реструктуризация:
    Выделение DeepSeek Global как независимого юрлица
    Создание дочерней компании в Гонконге

Технологические прорывы в условиях изоляции

Несмотря на сложности, 2026 год принес значимые достижения:

  1. DeepSeek-Health:
    Медицинская диагностика с 98% точностью
    Одобрено к применению в 17 провинциях Китая
  2. Industrial AI Suite:
    Решения для "умных" заводов
    Внедрено на 120+ предприятиях
  3. Квантово-классический гибрид:
    Алгоритмы для 54-кубитного квантового компьютера
    Ускорение обучения на 40%

Этический манифест 2026

В ответ на международную критику DeepSeek опубликовала:

5 принципов ответственного ИИ:

  1. Суверенитет данных – информация не пересекает границы без согласия
  2. Человеческий контроль – запрет автономных решений в критических сферах
  3. Энергетическая осознанность – углеродно-нейтральные вычисления
  4. Инклюзивность – поддержка 100+ языков малых народов
  5. Прозрачность – публикация методик оценки моделей

"ИИ должен объединять, а не разделять человечество" – заключительный тезис манифеста.

Геополитические последствия

Действия DeepSeek оказали значительное влияние:

  1. Создание альянса "Независимый ИИ" (Китай, ОАЭ, Саудовская Аравия)
  2. Стимулирование европейских инициатив по технологическому суверенитету
  3. Пересмотр американских санкций – частичное смягчение для научного сотрудничества

К концу 2026 года DeepSeek стала не просто компанией, а символом технологической устойчивости в условиях глобальных бурь, доказав, что инновации могут развиваться даже в условиях жестких внешних ограничений.

Глава 5: DeepSeek 2027 – Взгляд в будущее и глобальные амбиции

Стратегическое позиционирование на мировом ИИ-рынке

К 2027 году DeepSeek завершила трансформацию в глобальную корпорацию с китайской спецификой, выработав уникальную бизнес-модель:

1. Три столпа стратегии:

  • Национальный чемпион: 55% доходов от китайского рынка (B2G-контракты, промышленный ИИ)
  • Глобальный новатор: 30% через партнерства в Азии и Африке
  • Технологический донор: 15% от открытых решений и лицензирования

2. Географическое распределение активов:

Diagram

Code

Технологическая дорожная карта 2027-2030

Ключевые разработки в процессе:

  1. DeepSeek-AGI Prototype
    Первая версия с элементами общего ИИ
    Ориентировочная дата: Q4 2028
    Бюджет: $1.2 млрд
  2. Квантово-нейронные гибриды
    Интеграция с 72-кубитными системами
    Потенциальное ускорение обучения в 1000 раз
  3. Биологически инспирированные архитектуры
    Нейроморфные чипы с имитацией работы мозга
    Потребление энергии снижено до 5W/token

Новая бизнес-экосистема

Основные направления монетизации:

  • DeepSeek Enterprise Suite: комплексные решения для корпораций
  • Edge AI Box: автономные устройства для промышленности
  • AI Governance Platform: инструменты для госрегуляторов
  • Consumer AI Subscriptions: 150 млн подписчиков к 2030

Финансовые показатели (прогноз на 2027):

  • Выручка: $4.8 млрд (+35% к 2026)
  • R&D расходы: $1.9 млрд (40% revenue)
  • Рыночная капитализация: $58 млрд (оценка Goldman Sachs)

Глобальные вызовы и стратегии ответа

1. Технологическая блокада:

  • Проблема: Ограничения на поставки высокотехнологичного оборудования
  • Решение: Полная вертикальная интеграция от чипов до софта

2. "Война талантов":

  • Проблема: Конкуренция за специалистов с OpenAI и Google
  • Решение: Программа "Golden Phoenix" (пакеты до $5 млн для топ-исследователей)

3. Этические дилеммы:

  • Проблема: Обвинения в двойных стандартах (разные версии для разных рынков)
  • Решение: Единый этический комитет с международными экспертами

Партнерства нового типа

1. С автопроизводителями:

  • Совместно с BYD создана нейросеть для беспилотников 5-го уровня
  • Внедрение в 3 млн автомобилей к 2028

2. С фармацевтикой:

  • Альянс с Sinopharm для AI-разработки лекарств
  • Сокращение времени R&D с 10 до 2.5 лет

3. С государственными структурами:

  • Платформа "Социальный кредит 3.0" (спорный проект)
  • Система прогнозирования экономических рисков для Минфина КНР

Конкуренция за будущее

Видение основателя

Лян Вэньфэн в интервью Caixin (январь 2027) обозначил 3 ключевых принципа:

  1. "Технологический суверенитет – не изоляция, а право на собственный путь"
  2. "ИИ должен служить конкретным людям, а не абстрактным "рынкам""
  3. "Настоящее лидерство – это когда тебя копируют, но не могут догнать"

Прогнозы и сценарии развития

Оптимистичный сценарий (2030):

  • Достижение AGI-уровня в узких областях
  • 10% доля глобального ИИ-рынка
  • Выход на IPO с оценкой $120 млрд

Консервативный сценарий:

  • Сохранение нишевых позиций
  • Фокус на азиатские рынки
  • Капитализация на уровне $40-60 млрд

Революционный потенциал:

  • Возможность переопределить глобальные стандарты ИИ
  • Создание полноценной "незападной" технологической экосистемы
  • Влияние на геополитический баланс сил

Заключение

DeepSeek к 2027 году представляет не просто компанию, а альтернативную модель развития ИИ – более прагматичную, энергоэффективную и ориентированную на реальные сектора экономики. Ее успех или провал определит, сможет ли технологический мир остаться многополярным, или западные стандарты станут единственно возможными.

Как отмечает профессор MIT Линь Вэй: "DeepSeek – это зеркало, в котором Запад видит свое возможное технологическое будущее: мир, где они больше не диктуют правила". Независимо от исхода, компания уже изменила глобальный ИИ-ландшафт, доказав, что инновации могут рождаться в любых условиях.

  1. Эффективность > бюджеты — можно создавать мощные ИИ без миллиардных затрат.
  2. Открытость как стратегия — MIT-лицензия помогла привлечь разработчиков.
  3. Геополитика влияет на ИИ — санкции США не остановили DeepSeek, но заставили искать новые пути.

Как сказал Лян Вэньфэн:

"Мы не гнались за прибылью — мы хотели доказать, что ИИ можно делать умнее и дешевле".

Сегодня DeepSeek — не просто стартап, а символ технологического прорыва Китая, который изменил правила игры в мировой индустрии ИИ.