Есть вероятность, что китайская языковая модель DeepSeek, запуск которой спровоцировал обвал фондового рынка США и снизил капитализацию Nvidia на ошеломляющие 600 млрд долларов, на самом деле стоила китайской компании не в несколько раз, а на порядки больше, чем утверждалось ранее. Ранее сообщалось, что обучение модели обошлось всего в 5-6 млн долларов, что выглядит крайне скромно по сравнению с сотнями миллионов, которые вкладывают западные корпорации. Однако эксперты из SemiAnalysis, проанализировав доступные данные, пришли к выводу, что реальные затраты на DeepSeek оказались примерно в сто раз выше официально заявленных. Согласно отчету, DeepSeek располагает примерно 10 000 графическими процессорами Nvidia H800, предназначенными для китайского рынка, и еще 10 000 более дорогостоящими чипами H100. Помимо этого, компания вложилась в ускорители H20 и использует совместный пул вычислительных ресурсов вместе с китайским хедж-фондом High-Flyer для торговли, вывода, обучения и исследований
Китайская нейросеть DeepSeek вовсе не стала революцией. Реальные расходы на её обучение оказались в 400 раз выше заявленных!
9 февраля 20259 фев 2025
1
1 мин