1287 подписчиков

DeepSeek остается одним из самых популярных приложений в мире. Но им недовольны во многих странах (а в одной даже заблокировали)

5 февраля 20255 фев 2025

2 мин

Сомнению также подверглись заявления по поводу ресурсов, затраченных на обучение универсальной большой языковой модели DeepSeek V3, которая лежит в основе чат-бота. Разработчики утверждают, что потратили на этот процесс всего 5,6 миллиона долларов, использовав чуть больше двух тысяч чипов Nvidia. Однако в реальности эта сумма может быть гораздо выше. Стартап DeepSeek и хедж-фонд High-Flyer, которому он принадлежит, имеет доступ к десяткам тысяч графических процессоров Nvidia, пишет Financial Times со ссылкой на сотрудника аналитической компании SemiAnalysis Дилана Пателя. Эти ресурсы, вероятно, использовали для обучения V3 и ее предшественниц (свою первую ИИ-модель DeepSeek выпустил еще в ноябре 2023-го). «DeepSeek потратила более 500 миллионов долларов на графические процессоры за всю историю компании, — отметил Патель. — Несмотря на то, что их процесс обучения был очень эффективным, он потребовал масштабных экспериментов и тестов». Власти США тоже усомнились, что заявления разработчи

Что происходит с китайским чат-ботом и почему разработчиков подозревают во лжи?

Стартап DeepSeek и хедж-фонд High-Flyer, которому он принадлежит, имеет доступ к десяткам тысяч графических процессоров Nvidia, пишет Financial Times со ссылкой на сотрудника аналитической компании SemiAnalysis Дилана Пателя. Эти ресурсы, вероятно, использовали для обучения V3 и ее предшественниц (свою первую ИИ-модель DeepSeek выпустил еще в ноябре 2023-го).

«DeepSeek потратила более 500 миллионов долларов на графические процессоры за всю историю компании, — отметил Патель. — Несмотря на то, что их процесс обучения был очень эффективным, он потребовал масштабных экспериментов и тестов».

Власти США тоже усомнились, что заявления разработчиков о количестве использованных чипов соответствуют действительности. Чиновники из Белого дома и ФБР выясняют, мог ли стартап получить доступ к графическим процессорам в обход экспортного контроля через третьи страны, пишет Bloomberg. Одним из таких поставщиков мог стать Сингапур, который, согласно официальным данным, обеспечивает 20% выручки Nvidia. При этом большинство поставок отправляются в другие страны, а не в Сингапур.

В Nvidia заявили, что следят, чтобы партнеры соблюдали все необходимые законы, поэтому нет прямой связи между поставками чипов в Сингапур и их возможным появлением в Китае. В компании отметили, что в их публичной отчетности указано не место доставки, а место выставления счета. «У многих наших клиентов есть бизнес-структуры в Сингапуре, которые они используют для продукции, предназначенной для США и западных стран», — отметили в Nvidia.

Несмотря на финансовые потери, к которым привела неожиданная популярность DeepSeek, компания Nvidia может быть заинтересована в дальнейшем росте стартапа. Ее чипы используются как для обучения, так и для обработки запросов пользователей. Причем выручка от продажи процессоров для этих двух целей, по данным Financial Times, уже сравнялась.

Стартап DeepSeek действительно может тратить меньше вычислительных ресурсов на обучение, чем аналоги. Но вместе с тем ее модели, особенно DeepSeek R1, нуждаются в дополнительной мощности при генерации длинных ответов, требующих сложных логических цепочек и рассуждений, пишет издание MIT Technology Review.

Кроме того, так как у всех моделей DeepSeek открытый исходный код, на рынке может появиться множество новых разработчиков, которые займутся созданием недорогих моделей, также нуждающихся в вычислительных ресурсах. В перспективе это может привести к росту спроса на чипы Nvidia.

Подпишитесь на канал "Жизнь Дурова: ЗОЖ, деньги, ИТ" - все самое главное о здоровье, технологиях и деньгах