19,7 тыс подписчиков

Китай уничтожил американский ИИ? Не так быстро!

27 января 202527 янв 2025

163

1 мин

Китайский стартап DeepSeek на днях произвел революцию. Он выкатил инновационную модель ИИ, способную задвинуть гиганта OpenAI. ChatGPT в AppStore он уже обогнал. Козырной туз DeepSeek — цена Его модель в 14 раз дешевле GPT-4 и обучалась на графических процессорах Nvidia H800 всего 2 месяца. Такую немыслимую эффективность китайской модели подарили уникальные архитектуры Multi-token Prediction (MTP) и Mixture of Experts (MoE). Пока OpenAI ставит на сложные и дорогие системы с миллиардами параметров, DeepSeek использует минимум вычислительных ресурсов без ущерба производительности. DeepSeek – убийца Nvidia? «Покупайте дорогущие GPU для обучения ИИ, без этого никак!», – убеждал нас американский гигант. Но DeepSeek, построенный на менее мощных GPU, показал, что сверхдорогие серверы не так уж и нужны. Пока чат GPT-4 активирует 1,8 трлн параметров одновременно, DeepSeek применяет другую стратегию, где затраты на обучение снижены до 90%. И что самое печальное для конкурентов, его производитель

Китайский стартап DeepSeek на днях произвел революцию. Он выкатил инновационную модель ИИ, способную задвинуть гиганта OpenAI. ChatGPT в AppStore он уже обогнал.

Козырной туз DeepSeek — цена

Его модель в 14 раз дешевле GPT-4 и обучалась на графических процессорах Nvidia H800 всего 2 месяца. Такую немыслимую эффективность китайской модели подарили уникальные архитектуры Multi-token Prediction (MTP) и Mixture of Experts (MoE).

Пока OpenAI ставит на сложные и дорогие системы с миллиардами параметров, DeepSeek использует минимум вычислительных ресурсов без ущерба производительности.

DeepSeek – убийца Nvidia?

«Покупайте дорогущие GPU для обучения ИИ, без этого никак!», – убеждал нас американский гигант. Но DeepSeek, построенный на менее мощных GPU, показал, что сверхдорогие серверы не так уж и нужны.

Пока чат GPT-4 активирует 1,8 трлн параметров одновременно, DeepSeek применяет другую стратегию, где затраты на обучение снижены до 90%. И что самое печальное для конкурентов, его производительность при этом не хуже.

А еще у DeepSeek открытый исходный код. Теперь любой студент может замутить стартап и разработать собственные решения, не тратя миллионы на обучение:

использование API у OpenAI стоит $2,5 за 1млн токенов;
у DeepSeek — всего $0,14.

Что и говорить, гиганты в панике. Трамп тут недавно собрался инвестировать полтриллиона долларов в ИИ. Но надо ли «затапливать» деньгами такие компании, если все то же самое можно сделать намного дешевле?

Ждем медиавойну США и Китая: каждая сторона будет убеждать человечество, что только они делают нормальный ИИ, а оппоненты пытаются втюхать неработающую ерунду за большие деньги.

Хотя китайская модель хорошо работает, однако до ChatGPT ей еще, как от Москвы до Пекина пешком: не хватает многих фишек.

Возможно, их докрутят, но ведь и американцы сейчас могут взять на вооружение новый подход DeepSeek к вычислениям, снова завоевав лидерство в этой сфере.

Подписывайтесь на наш канал в Телеграм: все главные новости о финансах, ничего лишнего!