Найти в Дзене
РР-Новости

Китайский стартап DeepSeek заявляет о низком потреблении ресурсов для модели R1, но аналитики утверждают обратное

Китайский стартап DeepSeek привлёк внимание технологического мира заявлением о крайне низком потреблении вычислительных ресурсов для разработки своего передового продукта R1. Эта модель может конкурировать с o1 от OpenAI, несмотря на то, что её обучение якобы обошлось всего в $6 млн и задействовало 2048 графических процессоров. Однако аналитическая фирма SemiAnalysis выяснила, что компания, стоящая за DeepSeek, потратила на оборудование $1,6 млрд и располагает парком из 50 000 графических процессоров Nvidia Hopper. Согласно отчету SemiAnalysis, DeepSeek располагает крупной вычислительной инфраструктурой, включающей около 50 000 графических процессоров Hopper, в том числе 10 000 H800 и 10 000 более мощных H100, а также другие устройства H20. Эти ресурсы распределены по нескольким площадкам и используются для таких целей, как обучение ИИ, исследования и финансовое моделирование. Общие капитальные вложения компании в серверы составляют $1,6 млрд, а операционные расходы оцениваются в $944

Китайский стартап DeepSeek привлёк внимание технологического мира заявлением о крайне низком потреблении вычислительных ресурсов для разработки своего передового продукта R1. Эта модель может конкурировать с o1 от OpenAI, несмотря на то, что её обучение якобы обошлось всего в $6 млн и задействовало 2048 графических процессоров. Однако аналитическая фирма SemiAnalysis выяснила, что компания, стоящая за DeepSeek, потратила на оборудование $1,6 млрд и располагает парком из 50 000 графических процессоров Nvidia Hopper.

Согласно отчету SemiAnalysis, DeepSeek располагает крупной вычислительной инфраструктурой, включающей около 50 000 графических процессоров Hopper, в том числе 10 000 H800 и 10 000 более мощных H100, а также другие устройства H20. Эти ресурсы распределены по нескольким площадкам и используются для таких целей, как обучение ИИ, исследования и финансовое моделирование. Общие капитальные вложения компании в серверы составляют $1,6 млрд, а операционные расходы оцениваются в $944 млн.

DeepSeek выросла из китайского хедж-фонда High-Flyer, который рано начал инвестировать в технологии искусственного интеллекта и активно закупал графические процессоры. В 2023 году High-Flyer выделил DeepSeek в отдельное предприятие, которое полностью сосредоточилось на разработке ИИ. В отличие от многих конкурентов, DeepSeek финансируется исключительно за счет собственных средств, что обеспечивает ей гибкость и оперативность в принятии решений.

Хотя DeepSeek позиционируется как небольшая компания, по данным SemiAnalysis, она инвестировала в свои разработки более $500 млн. В отличие от большинства ИИ-стартапов, которые полагаются на внешних поставщиков облачных услуг, DeepSeek обладает собственными дата-центрами, что обеспечивает полный контроль над экспериментами и оптимизацией моделей, ускоряя процесс разработки.

Также стоит отметить, что DeepSeek активно привлекает талантливых специалистов исключительно из материкового Китая, делая акцент на практических навыках и умениях, а не на формальных дипломах. Сообщается, что ИИ-исследователи в DeepSeek могут получать свыше $1,3 млн в год.

Совокупный подход к разработке, сосредоточенный на эффективности и алгоритмах, может привести к дальнейшим успехам в области ИИ и снизить спрос на высококлассные GPU, что может негативно сказаться на компаниях вроде Nvidia. Тем не менее, недавние заявления DeepSeek о низких затратах на обучение модели вызвали большие сомнения, так как они не учитывают расходы на исследование, доработку модели и общую инфраструктуру.

]]>