В мире искусственного интеллекта информация о стоимости обучения моделей часто становится предметом обсуждения. Исследовательская компания SemiAnalysis обнародовала отчет, который ставит под сомнение общепринятые представления о финансовых затратах на обучение модели DeepSeek V3. Вместо ожидаемых $6 миллионов, реальная сумма достигает $1,3 миллиарда. Отчет SemiAnalysis подробно рассматривает структуру затрат DeepSeek, акцентируя внимание на том, что оценка в 6 миллионов долларов учитывает только расходы на предварительное обучение графических процессоров. При этом не учитываются значительные инвестиции в исследования, разработки и инфраструктуру. В частности, DeepSeek несет затраты на серверы, которые составляют $1,3 миллиарда. Эти средства направляются на поддержку обширных кластеров графических процессоров, необходимых для выполнения вычислительных задач. DeepSeek располагает примерно 50 000 графическими процессорами Hopper, однако это не равно 50 000 H100, как считали ранее. В дейст
Согласно отчету SemiAnalysis, затраты на обучение DeepSeek V3 превышают $6 млн
1 февраля 20251 фев 2025
6
1 мин