Китайский технологический стартап DeepSeek завершил свой ежедневный технический проект в рамках «Недели открытого кода» громким заявлением: его онлайн-сервисы вывода данных (inference services) показали выдающуюся теоретическую маржу в 545% за 24 часа благодаря передовым технологическим оптимизациям. В своём сообщении компания заявила, что средняя загрузка узлов (node occupancy) для её моделей V3 и R1 составила 226.75 с полудня по пекинскому времени 27 февраля. Каждый узел, состоящий из восьми GPU Nvidia H800, арендованных по цене $2 за GPU в час, обходился в общей сложности в $87,072 операционных затрат. За тот же период модели обработали в совокупности 608 миллиардов входных токенов и 168 миллиардов выходных токенов, включая запросы пользователей через веб-интерфейс, мобильные приложения и API. Если бы стоимость этих услуг рассчитывалась по тарифам модели R1, это принесло бы выручку в размере $562 027, обеспечив теоретическую маржу в 545%. Узлы представляют собой отдельные вычислител
DeepSeek продемонстировал эффективность моделей V3 и R1 с теоретической маржой в 545%
2 марта 20252 мар 2025
16
3 мин