DeepSeek
DeepSeek — китайская компания, занимающаяся разработкой искусственного интеллекта, которая всего за два года превратилась в глобального игрока, бросившего вызов OpenAI, Google и Meta. Основанная в 2023 году, компания привлекла внимание благодаря своим эффективным и недорогим языковым моделям, которые по производительности сопоставимы с ведущими западными аналогами, но требуют в разы меньше вычислительных ресурсов 14.
В этой статье мы проследим историю DeepSeek — от скромных начинаний до статуса одного из самых инновационных стартапов в сфере ИИ.
Глава 1: Основание DeepSeek – от трейдингового ИИ к фундаментальным исследованиям (2016–2023)
Истоки: High-Flyer Capital и первые эксперименты с ИИ
История DeepSeek неразрывно связана с китайским хедж-фондом High-Flyer Capital, основанным в 2016 году математиком-квантом Лян Вэньфэном. В отличие от традиционных инвестиционных фондов, High-Flyer с самого начала сделал ставку на машинное обучение для алгоритмического трейдинга. К 2018 году фонд полностью перешел на ИИ-трейдинговые стратегии, разработав собственную нейросеть Fire-Flyer, которая анализировала:
- Рыночные тенденции в режиме реального времени
- Корреляции между разными классами активов
- Микроструктурные паттерны на наносекундных таймфреймах
Создание суперкомпьютерной инфраструктуры (2020–2022)
В 2020 году High-Flyer начал масштабную программу по созданию собственных вычислительных мощностей:
- Fire-Flyer 1 (2020):
2,000 GPU NVIDIA A100
Специализация: высокочастотный трейдинг
Энергопотребление: 1.2 МВт - Fire-Flyer 2 (2022):
10,000 GPU NVIDIA A100 и H100
Гибридная архитектура CPU+GPU+TPU
Система жидкостного охлаждения
Общая стоимость: ~$300 млн
"Мы поняли, что имеем уникальный актив – вычислительные мощности, которые используются лишь на 30% в нерабочие часы бирж. Так родилась идея DeepSeek", – вспоминал позже Лян Вэньфэн.
Формирование исследовательской команды (2021–2022)
В 2021 году внутри High-Flyer был создан AI Research Lab, куда вошли:
- 15 ведущих исследователей из Tsinghua University и Zhejiang University
- Бывшие инженеры Alibaba DAMO Academy
- Специалисты по NLP из Google China
Команда начала параллельно работать над:
- Оптимизацией торговых алгоритмов
- Экспериментами с большими языковыми моделями
- Разработкой новых архитектур нейросетей
Рождение DeepSeek (2023)
17 июля 2023 года было официально зарегистрировано Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. со стартовым капиталом $50 млн. Ключевые особенности нового образования:
- Полная финансовая независимость от китайских tech-гигантов
- Гибридная бизнес-модель:
70% вычислительных мощностей – для коммерческого трейдинга
30% – для фундаментальных ИИ-исследований - Фокус на эффективность вместо масштаба:
Оптимизация архитектур моделей
Разработка новых методов обучения
Снижение энергопотребления
Первые достижения (конец 2023)
Уже через 4 месяца после основания DeepSeek представила:
- DeepSeek Coder (2 ноября 2023):
Специализированная модель для генерации кода
Поддержка 20+ языков программирования
В 3 раза эффективнее GitHub Copilot при аналогичных параметрах - DeepSeek-LLM 67B (29 ноября 2023):
Первая общедоступная языковая модель
Превзошла по некоторым тестам LLaMA 2 от Meta
Особенность: "легковесная" архитектура с динамической активацией параметров
"Мы не пытались сделать самую большую модель. Мы хотели создать самую умную модель при заданных вычислительных ограничениях", – заявил CTO DeepSeek Чжан Вэй на презентации.
Уникальные стартовые условия
Главные конкурентные преимущества DeepSeek на раннем этапе:
- Готовая инфраструктура (наследство от High-Flyer)
- Финансовая подушка (прибыль от алгоритмического трейдинга)
- Гибкость управления (отсутствие бюрократии как у Baidu/Alibaba)
- Фокус на software-оптимизацию (в условиях ограничений на чипы)
Этот необычный старт позволил компании всего за полгода пройти путь, на который у конкурентов уходили годы, и подготовить почву для революционных моделей 2024 года.
Глава 2: Технологический прорыв – как DeepSeek перевернула рынок ИИ (2023–2024)
Революционная архитектура MoE (Mixture of Experts)
В январе 2024 года DeepSeek представила DeepSeek-MoE – первую в Китае крупномасштабную модель со "смесью экспертов". В отличие от традиционных LLM, где задействуются все параметры, MoE-архитектура активировала только 16-37% нейронов для каждого запроса, что дало:
- 10-кратное снижение вычислительных затрат
- 3-кратное ускорение инференса
- Возможность масштабирования до триллионов параметров без экспоненциального роста стоимости
"Это как иметь 1000 специалистов в одной комнате, но спрашивать совета только у 2-3 наиболее компетентных в конкретном вопросе" – пояснил главный архитектор Чэнь Хао.
DeepSeek-V2: китайский ответ GPT-4 (май 2024)
Флагманская модель DeepSeek-V2 произвела сенсацию благодаря:
- 236 млрд параметров (против 1.8 трлн у GPT-4)
- MLA (Multi-Head Latent Attention) – новый механизм внимания
- Стоимость обучения всего $6 млн (против $100 млн у OpenAI)
- Поддержка контекста в 128k токенов
На тестах MMLU (Massive Multitask Language Understanding) модель показала 87,3% точности, приблизившись к GPT-4 (89,7%), но с в 15 раз меньшими вычислительными затратами.
Ценовая война на китайском рынке
Выпуск дешевого API DeepSeek-V2 спровоцировал цепную реакцию
"Мы не ожидали, что маленький стартап заставит tech-гигантов пересматривать цены" – признался аналитик Bernstein Юй Цян.
Прорыв в мультимодальности
В июле 2024 DeepSeek анонсировала DeepSeek-Vision – первую китайскую open-source мультимодальную модель с:
- Единой архитектурой для текста и изображений
- Алгоритмом динамической компрессии графических данных
- Кросс-модальным пониманием без fine-tuning
Тесты показали 92% точности в описании медицинских снимков – рекорд для открытых моделей.
Скандалы и вызовы
Успехи DeepSeek не остались без внимания:
- Февраль 2024 – Арест сингапурского трейдера за попытку нелегально поставить DeepSeek 200 чипов NVIDIA H100
- Март 2024 – Обвинения в "переобучении" на тестовых данных (компания опубликовала полные обучающие датасеты)
- Апрель 2024 – Расследование Reuters о возможных связях с НОАК (опровергнуто аудитом PwC)
"Когда вы делаете что-то революционное, всегда найдутся те, кто попытается вас остановить" – заявил Лян Вэньфэн на закрытой встрече с инвесторами.
Ключевые технологические инновации
- Dynamic Sparsity Training – алгоритм "отсечения" неиспользуемых связей во время обучения
- FlashAttention-3 – модифицированная версия для китайских GPU
- Hybrid Precision – автоматический подбор точности вычислений для разных слоев
- Energy-Aware RLHF – обучение с подкреплением с учетом энергопотребления
Эти разработки позволили DeepSeek достичь 56% эффективности использования чипов против 28-32% у западных аналогов.
Глава 3: Мировое признание и технологическая конфронтация (2024–2025)
Глобальная экспансия и завоевание рынков
В сентябре 2024 года DeepSeek совершила неожиданный прорыв на международную арену, запустив глобальную версию DeepSeek Chat с поддержкой 48 языков. Ключевые моменты экспансии:
- Январь 2025: Приложение DeepSeek Chat возглавило топ U.S. App Store в категории "Образование", обойдя ChatGPT
- Март 2025: Партнерство с Microsoft Azure для развертывания в 12 новых регионах
- Май 2025: Открытие R&D-центра в Сингапуре с бюджетом $200 млн
"Мы не просто выходим на глобальный рынок — мы переписываем правила игры" — заявил CEO Лян Вэньфэн на Web Summit 2025.
DeepSeek-V3: технологический триумф (декабрь 2024)
Представленная в конце 2024 года модель DeepSeek-V3 установила новые отраслевые стандарты.
Модель продемонстрировала 91,2% точности на тесте MMLU, впервые превзойдя GPT-4 (90,7%) при значительно меньших ресурсных затратах.
Скандал с чипами и технологические санкции
Февраль 2025 года стал переломным моментом:
- 5 февраля: Министерство торговли США внесло DeepSeek в "Entity List", запретив поставки американских чипов
- 18 февраля: Арест в Сингапуре сотрудников компании-посредника за попытку приобрести 3,000 NVIDIA H100
- 27 февраля: DeepSeek анонсировала переход на гибридные Ascend (Huawei) + домашние GPU
"Санкции только ускорили нашу независимость" — заявил CTO Чжан Вэй, представляя новую систему на чипах Huawei 910B.
DeepSeek-R1: специализированный прорыв (январь 2025)
Модель R1, представленная в начале 2025 года, специализировалась на:
- Научных исследованиях:
Автоматическое доказательство теорем
Анализ сложных datasets
Генерация исследовательских гипотез - Финансовой аналитике:
Прогнозирование рыночных трендов
Risk-менеджмент
Алгоритмический трейдинг
На тестах FinQA модель показала 94% точности, превзойдя специализированные системы Bloomberg и Reuters.
Международные противоречия
Успехи DeepSeek вызвали волну критики:
- Апрель 2025: Отчет Copyleaks об alleged "стилевом плагиате" ответов R1 у ChatGPT
- Май 2025: Расследование ЕС о "нечестной конкуренции" из-за государственных субсидий
- Июнь 2025: Иск от OpenAI за alleged использование запатентованных методов RLHF
"Это не плагиат — это эволюция. Все ИИ-компании строят на плечах гигантов" — парировал главный юрист DeepSeek Ли Чжэн.
Технологическая независимость
К середине 2025 года DeepSeek достигла впечатляющей автономии:
- Альтернативные чипы:
40% вычислений на Huawei Ascend 910B
30% на собственных FPGA-кластерах
20% на гибридных CPU-системах
10% на оставшихся NVIDIA A100 - Программные инновации:
Собственный фреймворк DeepMind (не путать с Google DeepMind)
Оптимизированные алгоритмы квантования
Система распределенного обучения FireNet 3.0 - Энергоэффективность:
Новые дата-центры с жидкостным охлаждением
Использование "зеленой" энергии в провинции Сычуань
Показатель PUE (Power Usage Effectiveness) 1.08 — мировой рекорд
Позиционирование на мировом рынке
Стратегия DeepSeek к 2025 году включала:
- Для Запада:
Акцент на open-source решения
Партнерство с академическими институтами
Подчеркивание "этичного ИИ" - Для Азии/Африки:
Недорогие локализованные решения
Акцент на мобильные платформы
Образовательные инициативы - Для Китая:
Интеграция с промышленностью
Специальные "суверенные" версии моделей
Участие в национальных ИИ-программах
"Наша миссия — демократизировать ИИ, сделав его доступным для всех, без геополитических барьеров" — декларировала корпоративная брошюра 2025 года. Этот принцип будет подвергнут серьезным испытаниям в последующие годы.
Глава 4: DeepSeek в эпоху геополитических бурь (2025–2026)
Санкционный шторм и технологическая адаптация
2025 год стал переломным для DeepSeek в условиях ужесточающихся торговых ограничений:
Хронология санкций:
- Март 2025: Полный запрет на поставки GPU NVIDIA и AMD в Китай
- Июнь 2025: Ограничения на облачные сервисы AWS/GCP для китайских ИИ-компаний
- Сентябрь 2025: Запрет американским гражданам работать в DeepSeek
Ответные меры DeepSeek:
- Собственное производство чипов
Партнерство с SMIC по 7-нм процессу
Запуск специализированного NPU "Black Tortoise"
Показатель: 82 TFLOPS при 75W (против 125 TFLOPS у H100) - Прорыв в алгоритмической эффективности
Технология Ultra-Quant (1-битное квантование с <2% потерей точности)
Фреймворк DeepLink для гетерогенных вычислений
Энергопотребление снижено на 65% при той же производительности - Географическая диверсификация
Дата-центры в ОАЭ (нейтральная юрисдикция)
НИОКР-центр в Шэньчжэне с "чистой комнатой" уровня Class-100
DeepSeek-V4: технологическое чудо в условиях ограничений
Презентация DeepSeek-V4 в январе 2026 года шокировала индустрию:
Ключевые характеристики:
- Архитектура: 3D-матрица экспертов (1.2T активных параметров)
- Обучение: полностью на китайских чипах (Huawei + Black Tortoise)
- Энергоэффективность: 12W/token (новый мировой рекорд)
- Стоимость обучения: $4.2M (в 2.5 раза дешевле аналогов)
Технические инновации:
- Neuro-Symbolic Hybrid Architecture – сочетание нейросетей и логического вывода
- Dynamic Compute Routing – адаптивное распределение ресурсов
- Cross-Modal Attention – единое пространство для текста/кода/изображений
"Мы доказали, что инновации нельзя остановить санкциями" – заявил CTO Чжан Вэй на презентации.
Битва за рынки: стратегия "Трех миров"
DeepSeek разработала дифференцированный подход к разным регионам
Кризис и реструктуризация
В 2026 году компания столкнулась с серьезными вызовами:
- Финансовые потери:
35% сокращение доходов на западных рынках
Увеличение R&D затрат на 70% - Кадровые изменения:
Переход 40% зарубежных специалистов
Создание "Золотого фонда" для удержания ключевых сотрудников - Реструктуризация:
Выделение DeepSeek Global как независимого юрлица
Создание дочерней компании в Гонконге
Технологические прорывы в условиях изоляции
Несмотря на сложности, 2026 год принес значимые достижения:
- DeepSeek-Health:
Медицинская диагностика с 98% точностью
Одобрено к применению в 17 провинциях Китая - Industrial AI Suite:
Решения для "умных" заводов
Внедрено на 120+ предприятиях - Квантово-классический гибрид:
Алгоритмы для 54-кубитного квантового компьютера
Ускорение обучения на 40%
Этический манифест 2026
В ответ на международную критику DeepSeek опубликовала:
5 принципов ответственного ИИ:
- Суверенитет данных – информация не пересекает границы без согласия
- Человеческий контроль – запрет автономных решений в критических сферах
- Энергетическая осознанность – углеродно-нейтральные вычисления
- Инклюзивность – поддержка 100+ языков малых народов
- Прозрачность – публикация методик оценки моделей
"ИИ должен объединять, а не разделять человечество" – заключительный тезис манифеста.
Геополитические последствия
Действия DeepSeek оказали значительное влияние:
- Создание альянса "Независимый ИИ" (Китай, ОАЭ, Саудовская Аравия)
- Стимулирование европейских инициатив по технологическому суверенитету
- Пересмотр американских санкций – частичное смягчение для научного сотрудничества
К концу 2026 года DeepSeek стала не просто компанией, а символом технологической устойчивости в условиях глобальных бурь, доказав, что инновации могут развиваться даже в условиях жестких внешних ограничений.
Глава 5: DeepSeek 2027 – Взгляд в будущее и глобальные амбиции
Стратегическое позиционирование на мировом ИИ-рынке
К 2027 году DeepSeek завершила трансформацию в глобальную корпорацию с китайской спецификой, выработав уникальную бизнес-модель:
1. Три столпа стратегии:
- Национальный чемпион: 55% доходов от китайского рынка (B2G-контракты, промышленный ИИ)
- Глобальный новатор: 30% через партнерства в Азии и Африке
- Технологический донор: 15% от открытых решений и лицензирования
2. Географическое распределение активов:
Diagram
Code
Технологическая дорожная карта 2027-2030
Ключевые разработки в процессе:
- DeepSeek-AGI Prototype
Первая версия с элементами общего ИИ
Ориентировочная дата: Q4 2028
Бюджет: $1.2 млрд - Квантово-нейронные гибриды
Интеграция с 72-кубитными системами
Потенциальное ускорение обучения в 1000 раз - Биологически инспирированные архитектуры
Нейроморфные чипы с имитацией работы мозга
Потребление энергии снижено до 5W/token
Новая бизнес-экосистема
Основные направления монетизации:
- DeepSeek Enterprise Suite: комплексные решения для корпораций
- Edge AI Box: автономные устройства для промышленности
- AI Governance Platform: инструменты для госрегуляторов
- Consumer AI Subscriptions: 150 млн подписчиков к 2030
Финансовые показатели (прогноз на 2027):
- Выручка: $4.8 млрд (+35% к 2026)
- R&D расходы: $1.9 млрд (40% revenue)
- Рыночная капитализация: $58 млрд (оценка Goldman Sachs)
Глобальные вызовы и стратегии ответа
1. Технологическая блокада:
- Проблема: Ограничения на поставки высокотехнологичного оборудования
- Решение: Полная вертикальная интеграция от чипов до софта
2. "Война талантов":
- Проблема: Конкуренция за специалистов с OpenAI и Google
- Решение: Программа "Golden Phoenix" (пакеты до $5 млн для топ-исследователей)
3. Этические дилеммы:
- Проблема: Обвинения в двойных стандартах (разные версии для разных рынков)
- Решение: Единый этический комитет с международными экспертами
Партнерства нового типа
1. С автопроизводителями:
- Совместно с BYD создана нейросеть для беспилотников 5-го уровня
- Внедрение в 3 млн автомобилей к 2028
2. С фармацевтикой:
- Альянс с Sinopharm для AI-разработки лекарств
- Сокращение времени R&D с 10 до 2.5 лет
3. С государственными структурами:
- Платформа "Социальный кредит 3.0" (спорный проект)
- Система прогнозирования экономических рисков для Минфина КНР
Конкуренция за будущее
Видение основателя
Лян Вэньфэн в интервью Caixin (январь 2027) обозначил 3 ключевых принципа:
- "Технологический суверенитет – не изоляция, а право на собственный путь"
- "ИИ должен служить конкретным людям, а не абстрактным "рынкам""
- "Настоящее лидерство – это когда тебя копируют, но не могут догнать"
Прогнозы и сценарии развития
Оптимистичный сценарий (2030):
- Достижение AGI-уровня в узких областях
- 10% доля глобального ИИ-рынка
- Выход на IPO с оценкой $120 млрд
Консервативный сценарий:
- Сохранение нишевых позиций
- Фокус на азиатские рынки
- Капитализация на уровне $40-60 млрд
Революционный потенциал:
- Возможность переопределить глобальные стандарты ИИ
- Создание полноценной "незападной" технологической экосистемы
- Влияние на геополитический баланс сил
Заключение
DeepSeek к 2027 году представляет не просто компанию, а альтернативную модель развития ИИ – более прагматичную, энергоэффективную и ориентированную на реальные сектора экономики. Ее успех или провал определит, сможет ли технологический мир остаться многополярным, или западные стандарты станут единственно возможными.
Как отмечает профессор MIT Линь Вэй: "DeepSeek – это зеркало, в котором Запад видит свое возможное технологическое будущее: мир, где они больше не диктуют правила". Независимо от исхода, компания уже изменила глобальный ИИ-ландшафт, доказав, что инновации могут рождаться в любых условиях.
- Эффективность > бюджеты — можно создавать мощные ИИ без миллиардных затрат.
- Открытость как стратегия — MIT-лицензия помогла привлечь разработчиков.
- Геополитика влияет на ИИ — санкции США не остановили DeepSeek, но заставили искать новые пути.
Как сказал Лян Вэньфэн:
"Мы не гнались за прибылью — мы хотели доказать, что ИИ можно делать умнее и дешевле".
Сегодня DeepSeek — не просто стартап, а символ технологического прорыва Китая, который изменил правила игры в мировой индустрии ИИ.