Китайская нейросеть DeepSeek вовсе не стала революцией. Реальные расходы на её обучение оказались в 400 раз выше заявленных!

9 февраля 20259 фев 2025

1 мин

Есть вероятность, что китайская языковая модель DeepSeek, запуск которой спровоцировал обвал фондового рынка США и снизил капитализацию Nvidia на ошеломляющие 600 млрд долларов, на самом деле стоила китайской компании не в несколько раз, а на порядки больше, чем утверждалось ранее. Ранее сообщалось, что обучение модели обошлось всего в 5-6 млн долларов, что выглядит крайне скромно по сравнению с сотнями миллионов, которые вкладывают западные корпорации. Однако эксперты из SemiAnalysis, проанализировав доступные данные, пришли к выводу, что реальные затраты на DeepSeek оказались примерно в сто раз выше официально заявленных. Согласно отчету, DeepSeek располагает примерно 10 000 графическими процессорами Nvidia H800, предназначенными для китайского рынка, и еще 10 000 более дорогостоящими чипами H100. Помимо этого, компания вложилась в ускорители H20 и использует совместный пул вычислительных ресурсов вместе с китайским хедж-фондом High-Flyer для торговли, вывода, обучения и исследований

Ранее сообщалось, что обучение модели обошлось всего в 5-6 млн долларов, что выглядит крайне скромно по сравнению с сотнями миллионов, которые вкладывают западные корпорации. Однако эксперты из SemiAnalysis, проанализировав доступные данные, пришли к выводу, что реальные затраты на DeepSeek оказались примерно в сто раз выше официально заявленных.

Согласно отчету, DeepSeek располагает примерно 10 000 графическими процессорами Nvidia H800, предназначенными для китайского рынка, и еще 10 000 более дорогостоящими чипами H100. Помимо этого, компания вложилась в ускорители H20 и использует совместный пул вычислительных ресурсов вместе с китайским хедж-фондом High-Flyer для торговли, вывода, обучения и исследований. Совокупные капитальные вложения уже достигают 1,6 млрд долларов, а эксплуатационные расходы, по слухам, составляют около 944 млн долларов. Эти суммы примерно в 400 раз превышают первоначальные оценки рынков.

Похоже, те самые 5-6 млн долларов — это лишь отдельная статья расходов, вероятно, связанная с финальным этапом обучения модели.

Если приведенные расчеты верны, никакого чуда не произошло: DeepSeek не смогла переломить тенденцию, и создание крупных языковых моделей по-прежнему требует колоссальных финансовых затрат.