Найти в Дзене
Герман Геншин

DeepSeek: всё, что нужно знать о ИИ, который сместил ChatGPT с пьедестала

Стартап из Китая, существующий всего год, производит фурор в индустрии ИИ после выпуска чат-бота, который сопоставим с ChatGPT, но требует значительно меньше мощности, охлаждения и затрат на обучение по сравнению с системами OpenAI, Google и Anthropic. Давайте рассмотрим всё, что стоит знать о моделях DeepSeek V3 и R1, и почему компания может кардинально изменить планы США в области ИИ. DeepSeek (официально — «Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.») — это китайский стартап в области ИИ, который был изначально основан как лаборатория ИИ для своей материнской компании High-Flyer в апреле 2023 года. В мае 2023 года DeepSeek стал независимой компанией (при этом High-Flyer остался инвестором) и выпустил свою модель DeepSeek-V2. V2 показала производительность на уровне других ведущих китайских компаний в сфере ИИ, таких как ByteDance, Tencent и Baidu, но с гораздо меньшими затратами на эксплуатацию. В декабре 2024 года компания представила модель V3.
Оглавление

Стартап из Китая, существующий всего год, производит фурор в индустрии ИИ после выпуска чат-бота, который сопоставим с ChatGPT, но требует значительно меньше мощности, охлаждения и затрат на обучение по сравнению с системами OpenAI, Google и Anthropic. Давайте рассмотрим всё, что стоит знать о моделях DeepSeek V3 и R1, и почему компания может кардинально изменить планы США в области ИИ.

Что такое DeepSeek?

DeepSeek (официально — «Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.») — это китайский стартап в области ИИ, который был изначально основан как лаборатория ИИ для своей материнской компании High-Flyer в апреле 2023 года. В мае 2023 года DeepSeek стал независимой компанией (при этом High-Flyer остался инвестором) и выпустил свою модель DeepSeek-V2. V2 показала производительность на уровне других ведущих китайских компаний в сфере ИИ, таких как ByteDance, Tencent и Baidu, но с гораздо меньшими затратами на эксплуатацию.

В декабре 2024 года компания представила модель V3. Она обладает 671 миллиардом параметров и, как сообщается, была обучена менее чем за 2 месяца. Более того, по недавнему анализу от Jeffries, общая стоимость обучения составила всего 5.6 миллиона долларов (при условии аренды H800 за 2 доллара в час). Это менее 10% от стоимости модели Meta Llama. Это крошечная доля сотен миллионов и миллиардов долларов, которые американские компании, такие как Google, Microsoft, xAI и OpenAI, потратили на обучение своих моделей.

🚀 Представляем DeepSeek-V3!

Наибольший прорыв на сегодняшний день:
⚡ 60 токенов в секунду (в 3 раза быстрее, чем V2!)
💪 Расширенные возможности
🛠 API совместимость сохранилась
🌍 Полностью открытые модели и исследования

🐋 1/n pic.twitter.com/p1dV9gJ2Sd

— DeepSeek (@deepseek_ai) 26 декабря 2024 года

Тесты производительности показывают, что V3 сопоставим с GPT-4o и Claude 3.5 Sonnet. В одном из изданий в декабре 2024 года успех DeepSeek охарактеризовали как «Супутник для Америки».

В ноябре 2024 года DeepSeek выпустил модель R1-Lite-Preview, заявив, что новая модель может превзойти модель o1 от OpenAI (и делать это за гораздо меньшую цену). Компания оценивает, что модель R1 стоит от 20 до 50 раз дешевле в эксплуатации, в зависимости от задачи, чем o1 от OpenAI. В январе 2025 года компании были представлены модели DeepSeek-R1 и DeepSeek-R1-Zero. Модель R1, в отличие от своего соперника o1, является открытой, что дает возможность любому разработчику её использовать.

Таким образом, V3 и R1 быстро набирают популярность после своего выпуска, а AI Assistant на базе V3 вытеснил ChatGPT с верхних строчек магазинов приложений. Венчурный капиталист Марк Андриссен в недавнем посте в соцсетях назвал чат-бот DeepSeek «одним из самых потрясающих и впечатляющих прорывов, которые я когда-либо видел» и «глубоким подарком для мира».

Что может DeepSeek?

Как открытая модель с большим языковым охватом, чат-боты DeepSeek могут выполнять практически всё, что умеют ChatGPT, Gemini и Claude. Это включает в себя создание текста, аудио, изображений и видео. Более того, новая линейка многомодальных моделей, названная Janus Pro, якобы превосходит DALL-E 3, а также PixArt-alpha, Emu3-Gen и Stable Diffusion XL, по нескольким отраслевым стандартам. DeepSeek-R1, соперничающий с o1, специально создан для выполнения сложных аналитических задач, генерируя пошаговые решения и устанавливая «логические цепочки размышлений», где он объясняет свой процесс рассуждений поэтапно при решении проблемы.

ох, да #deepseek

— Алексис Мантзарлис (@mantzarlis.com) 27 января 2025 года

Однако продукты DeepSeek не могут обсуждать события на площади Тяньаньмэнь. Или протесты Желтой Зонтики. Или схожесть президента Си Цзиньпина с Винни Пухом. В общем, если это тема, которую Коммунистическая партия Китая считает запрещенной, чат-боты DeepSeek не будут её затрагивать и не смогут по нормальному общаться на эту тему.

Кто может воспользоваться DeepSeek?

Эндрю Тарантола / DeepSeek

В качестве открытой модели LLM DeepSeek доступен любому разработчику совершенно бесплатно. OpenAI взимает 200 долларов в месяц за подписку Pro для доступа к o1. Модели DeepSeek доступны в сети, через API компании и мобильные приложения. Однако для использования необходимо зарегистрировать бесплатный аккаунт на сайте DeepSeek, хотя компания временно приостановила регистрацию новых пользователей в ответ на "масштабные злонамеренные атаки на сервисы DeepSeek". Существующие пользователи могут входить в систему и использовать платформу как обычно, но пока нет информации о том, когда новые пользователи смогут попробовать DeepSeek самостоятельно.

Почему DeepSeek вдруг стал столь важным?

С момента выхода ChatGPT в ноябре 2023 года американские компании в сфере ИИ сосредоточились на создании всё более крупных, мощных и ресурсоёмких языковых моделей. Вместо того чтобы стремиться к более экономичным и эффективным моделям, такие компании, как OpenAI, Microsoft, Anthropic и Google просто решили продолжать развивать технологию с помощью огромных вложений денег и ресурсов. В 2024 году CEO xAI Илон Маск планировал потратить более 10 миллиардов долларов на инициативы в области ИИ. OpenAI и его партнёры только что объявили о 500-миллиардном проекте Stargate, который существенно ускорит строительство объектов зеленой энергетики и центров данных ИИ в США. Google, по сообщению CEO Сундара Пичая, собирается в 2025 году сосредоточиться на масштабировании платформы Gemini, ожидая потратить миллиарды на достижение этой цели. Meta в середине января ঘোষণাила, что в этом году потратит до 65 миллиардов долларов на разработку ИИ.

DeepSeek продемонстрировал миру, что все эти усилия не являются необходимыми — что «бум ИИ», который в последние месяцы способствовал развитию американской экономики и сделал такие компании, как Nvidia, невероятно богатыми, возможно, не более чем иллюзия. Это также ставит под сомнение, какую реальную преимущество имеет США в области ИИ, несмотря на постоянные запреты на поставки передовых графических процессоров в Китай afgelopen год.

«Суть здесь в том, что успешность США была обусловлена технологиями и лидерством американских компаний в области ИИ», — отметил Кейт Лернер, аналитик Truist, в интервью CNN. «Выход моделей DeepSeek заставляет инвесторов сомневаться, действительно ли американские компании всё ещё имеют преимущество и насколько их затраты оправданы (или это просто перерасход).»

В общем, DeepSeek только что обошёл американскую индустрию ИИ в её же игре, показав, что текущий лозунг «рост любой ценой» больше не работает. «Ясно, что у DeepSeek нет такого же вычислительного ресурса, как у американских гиперскалеров, и тем не менее они сумели разработать модель, которая выглядит весьма конкурентоспособной», — сказал Свини Паджури, аналитик в сфере полупроводников Raymond James, в интервью CNBC. Если китайскому стартапу удаётся создать модель ИИ, которая работает так же хорошо, как последняя разработка OpenAI, и сделать это менее чем за два месяца и всего за 6 миллионов долларов, тогда какой же смысл в Sam Altman?

«Время покажет, насколько реальной является угроза DeepSeek — гонка на то, какая технология сработает и как крупные западные игроки будут реагировать и развиваться», — сказал Микаэль Блок, стратег третьей Семи Кэпитал, в интервью CNN. «Рынки стали слишком самодовольными в начале эпохи Трампа 2.0 и, возможно, ждут повода для коррекции — и они его получили.»

DeepSeek только начал свой путь. Если вы хотите быть в курсе последних событий, обязательно добавьте нашу новостную ленту о DeepSeek в закладки.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Любите активный отдых на природе? Подписывайтесь на канал Поход лайфхак в Яндекс Дзен — кладезь полезных советов для любителей активного отдыха!

Вы также можете читать наши материалы в:

Deep Seek
20,9 тыс интересуются