В декабре 2024 года малоизвестная китайская компания DeepSeek взорвала мир ИИ, представив модель, сопоставимую с решениями таких гигантов, как OpenAI и Anthropic. Однако главное, что удивило сообщество, — её удивительная комбинация высокой производительности и низкой стоимости. Как небольшой стартап из Ханчжоу, насчитывающий всего 100 сотрудников, смог достичь таких результатов?
История DeepSeek тесно связана с одним из крупнейших китайских хедж-фондов — High-Flyer. Основанный в 2015 году тремя инженерами, Сюй Цзинем, Чжэн Давэем и Лян Вэньфэном, фонд быстро стал лидером в области алгоритмической торговли, управляя активами на сумму $15 млрд к 2021 году. Но в 2022 году всё изменилось: ужесточение регулирования финансового сектора в Китае привело к значительным убыткам. Тогда вместо закрытия бизнеса команда High-Flyer приняла смелое решение: создать компанию, полностью посвящённую искусственному интеллекту.
Хедж-фонд — это инвестиционный фонд, использующий сложные стратегии и алгоритмы для максимизации прибыли. Они часто ориентируются на высокорискованные активы, включая алгоритмическую торговлю, как это делал High-Flyer в начале своей истории.
Молодёжь и свобода: секреты успеха DeepSeek
В 2023 году появился стартап DeepSeek, который унаследовал от High-Flyer мощную технологическую инфраструктуру, включая 10,000 GPU NVIDIA A100, и уникальный подход к управлению. Вместо найма известных экспертов компания сделала ставку на молодых выпускников ведущих университетов Китая. Этот выбор оказался успешным: энтузиазм и свежий взгляд стали ключевыми факторами стремительного развития.
Особенностью DeepSeek является отсутствие формальных иерархий. Сотрудники сами формируют команды под проекты, а доступ к ресурсам предоставляется без бюрократических ограничений. Такая гибкость позволяет компании быстро адаптироваться к изменяющимся требованиям индустрии.
Лидер, который перевернул правила игры
Во главе DeepSeek стоит Лян Вэньфэн, выпускник факультета электронной инженерии Чжэцзянского университета, известного своими инновационными подходами к подготовке инженеров. В отличие от многих китайских руководителей, он никогда не работал в западных компаниях, что подчёркивает его независимость от традиционных моделей управления. Лян сочетает глубокие технические знания с редкими организационными способностями, что позволяет ему вдохновлять команду на достижение амбициозных целей. Коллеги отмечают его умение видеть перспективы развития компании и находить нестандартные решения в сложных ситуациях.
Прорывная модель, задавшая новый стандарт
В мае 2024 года компания представила DeepSeek-V2, что стало настоящим вызовом для остального китайского рынка ИИ. Модель предлагала производительность, сопоставимую с западными аналогами, но при этом её использование стоило в десятки раз дешевле. В результате многие китайские гиганты, такие как ByteDance и Tencent, были вынуждены пересмотреть свои ценовые стратегии. А с выпуском DeepSeek-V3 в декабре 2024 года стартап окончательно закрепился среди лидеров.
DeepSeek-V3 стала одной из самых мощных языковых моделей 2024 года, предлагая 685 миллиардов параметров и мультиэкспертную архитектуру. Это позволило компании добиться превосходства в тестах, требующих логического вывода и решения математических задач.
Видение будущего: от стартапа к экосистеме
Лян Вэньфэн видит будущее DeepSeek не только в создании языковых моделей, но и в трансформации компании в технологическую экосистему. Компания активно развивает три ключевых направления:
- Математика и программирование как тестовая площадка для улучшения моделей.
- Мультимодальные модели, объединяющие текст, изображения и видео.
- Углублённая обработка естественного языка для достижения универсального интеллекта.
По мнению Вэньфэна, достижение AGI возможно уже в ближайшие 2-10 лет. Несмотря на высокий уровень конкуренции, DeepSeek выделяется своим подходом, ориентированным на открытый исходный код и доступность технологий.
Независимость и открытость
Хотя DeepSeek возникла как побочный эффект государственного регулирования, компания подчёркивает свою независимость, что резко выделяет её на фоне большинства китайских технологических гигантов. Такой подход открывает перед DeepSeek уникальные возможности: сохранять гибкость, быстро адаптироваться к изменениям и экспериментировать с инновационными решениями без оглядки на внешние ограничения.
Связь с глобальными трендами
История DeepSeek перекликается с развитием других технологических лидеров, таких как Moonshot AI, представившей модель Kimi. Оба стартапа показывают, что успех в индустрии ИИ достигается не только благодаря финансовым вливаниям, но и за счёт уникальных идей и организационных подходов.
DeepSeek продолжает доказывать, что инновации не требуют огромных ресурсов. Как и Aurora от Xanadu, DeepSeek стремится изменить представление о технологиях будущего, делая их доступными и эффективными.
DeepSeek как символ перемен
DeepSeek — это больше, чем просто стартап. Это живая иллюстрация того, как упорство, новаторство и нестандартное мышление могут радикально трансформировать глобальную технологическую гонку. История компании вдохновляет, заставляя задуматься: а какие ещё технологические открытия изменят наше представление о будущем и как именно они повлияют на нашу жизнь?