Из-за нее 500 самых богатых людей мира потеряли 108 млрд долларов, на фондовом рынке произошел «Черный понедельник», а технологические компании испугались за свое будущее. Все это о новой нейросети DeepSeek, которая взорвала новостную повестку.
В этой статье разбираемся, что такое DeepSeek, чем она вызвала ажиотаж на рынке технологий, и почему ее использование станет особенно актуальным в России. Тестируем DeepSeek в маркетинговых задачах и сравниваем результаты с работой ChatGPT.
Что такое DeepSeek
DeepSeek-AI — китайская компания по разработке передовых AI-технологий и масштабных языковых моделей (LLM). Ее флагманский продукт — чат-бот DeepSeek.
Стартап основал в конце 2023 года Лян Вэньфэн, бывший глава хедж-фонда High-Flyer. По данным западных СМИ, он использовал искусственный интеллект для прогнозирования рыночных трендов.
DeepSeek, как и ChatGPT или Gemini, обучена на текстовых данных (книги, статьи, диалоги). В зависимости от версии, модель может быть настроена на решение конкретных задач, таких как: придумать ответ для пользователя, решить математическую задачу, написать продающий текст.
Кроме того, DeepSeek предсказывает наилучшие варианты ответа, используя паттерны, усвоенные во время обучения. Модель учитывает контекст диалога (предыдущие реплики в беседе), семантику запроса (скрытые намерения пользователя) и достоверность информации, исключая ошибки с помощью фильтров.
Недавно компания представила две новые модели:
1. DeepSeek-V3 — была представлена в декабре 2024 года. Она использует те же алгоритмы, что и ChatGPT: генерирует текст и отвечает на вопросы. Во время тестов модель превзошла такие системы, как Llama 3.1 от Meta (признана экстремистской организацией в России), GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic. Особенно удивило утверждение разработчиков, что на обучение модели ушло всего два месяца и 5,5 млн долларов, в то время как для GPT-4 было затрачено более 100 млн долларов.
2. DeepSeek-R1 — представили в январе 2025 года. Это продвинутая AI-модель, способная рассуждать, строить логические цепочки и самостоятельно проверять свои выводы, включая промежуточные.
Она даже может брать паузу, чтобы обдумать ответ. В ряде тестов R1 показала лучшие результаты, чем нейросеть o1 от OpenAI. По заявлениям разработчиков, модель решает задачи по математике, программированию и логике не хуже, а в некоторых случаях лучше конкурента. В то время как версия o1 в ChatGPT доступна только по подписке, DeepSeek-R1 предлагает пользователям множество бесплатных попыток.
DeepSeek также поддерживает поиск по интернету (кнопка Search) и умеет отображать код в интерфейсе чата.
Как DeepSeek обрушила фондовый рынок
DeepSeek стала причиной «Черного понедельника» на фондовом рынке. Bloomberg сообщает, что 27 января акции технологический компаний упали в связи с успехом новой нейросети, а 500 самых богатых людей мира потеряли 108 млрд долларов.
Индекс Nasdaq 100 снизился на 3% из-за успеха китайского стартапа. Это привело к потере почти $1 трлн капитализации компаний, входящих в индекс, сообщает Bloomberg.
Упали акции Microsoft, Tesla, Nasdaq и Broadcom, на 37% подешевели акции Nebius Group (бывшая Yandex N.V.), а особенно пострадала NVIDIA — ведущий поставщик чипов для искусственного интеллекта. Компания потеряла почти $500 млрд капитализации. При этом сама NVIDIA отметила достижения DeepSeek и назвала нейросеть «превосходным шагом вперед в сфере искусственного интеллекта».
Однако The Wall Street Journal называет падение на рынке временной ситуацией. По мнению журналистов, один стартап не потопит технологических гигантов из США.
Несмотря на ситуацию на рынке, ChatGPT не переживает. Он отвечает, что относится к новой нейросети спокойно и не верит, что конкурент сможет его заменить :)
Почему DeepSeek стала сенсацией
Модель DeepSeek активно обсуждают из-за ее низкой стоимости. Многие привыкли считать, что обучение нейросетей требует огромных затрат. Например, создание GPT-4 обошлось в более чем $100 млн, и это не считая затрат на дообучение до версий 4о и o1.
DeepSeek опровергла миф о необходимости больших вложений в нейросети. Компания раскрыла, что обучение ее новых моделей обошлось в $5,6 млн — значительно дешевле по сравнению с $100 млн — $1 млрд, о которых говорил в прошлом году генеральный директор компании Anthropic.
Новая нейросеть поставила ребром несколько важных вопросов:
- Если DeepSeek достиг таких результатов, потратив всего несколько миллионов, почему другим нейросетям нужны миллиарды?
- Насколько объективны текущие оценки стоимости компаний, занимающихся AI-технологиями?
- Не завышены ли ожидания относительно перспектив западных технологических корпораций?
Несмотря на это, аналитик Стейси Расгон из Bernstein считает данные о низких затратах DeepSeek «крайне обманчивыми».
Продолжение статьи читайте в блоге на нашем сайте. Там вы узнаете:
- Почему DeepSeek особенно актуальна в России
- Как зарегистрироваться в DeepSeek
- DeepSeek или СhatGPT: сравнение на рабочих задачах
- Отзывы о DeepSeek