Введение
На этой неделе мировые финансовые рынки пережили резкую волну колебаний. Биткойн, как 'барометр' высокорискованных активов, под воздействием обрушения на фондовом рынке США рухнул, его цена упала до 78 тысяч долларов, и причиной этого 'лавинного эффекта' стал коллективный спад акций американских технологических компаний, в эпицентре которого оказалась NVIDIA - гигант по производству AI-чипов, чьи акции упали на 10,2% за первую неделю, а капитализация сократилась более чем на 300 миллиардов долларов, что напрямую повлияло на снижение индекса S&P 500 на 4,7% и Nasdaq 100 на 5,9%. Подъем и падение биткойна - это лишь внешние проявления, чтобы исследовать глубокие причины краха фондового рынка США, нам необходимо обратить внимание на новую переменную: DeepSeek в 'неделе открытого кода' представила пять ключевых технологий, заявив, что они могут обеспечить тройное увеличение вычислительных мощностей на существующем оборудовании, что вызвало у рынка сомнения в будущем чиповой монополии.
Обрушение акций NVIDIA: 'Ватерлоо' империи оборудования
Падение акций NVIDIA не случайно, это результат накопленного давления:
- Предупреждение о доходах: учреждения предсказывают, что рост выручки от центров обработки данных NVIDIA в первом квартале 2025 года замедлится с 75% до 48%, ожидания рынка по спросу на оборудование быстро остывают.
- Тень замещения технологий: в ту же неделю китайский новый игрок AI DeepSeek громко провел 'неделю открытого кода', представив пять программных технологий, которые, по их словам, могут увеличить эффективность вычислительных мощностей на существующих GPU в 3 раза. Это не только подорвало коммерческую логику 'накопления чипов' NVIDIA, но и заставило инвесторов почувствовать запах 'деколонизации NVIDIA'.
За этой бурей на фондовом рынке весы конкуренции в вычислительных мощностях AI наклоняются - от 'эры грубой силы' с накоплением оборудования к 'эры интеллектуального превосходства' с программной оптимизацией.
Неделя открытого кода DeepSeek: 'вычислительная мощность, определяемая программным обеспечением', пять мощных ударов
Пять открытых технологий DeepSeek - это не просто оптимизация кода, а полная 'революция вычислительных мощностей программного обеспечения', они переопределили отношения между вычислениями, коммуникацией и хранением, сделав обучение и вывод AI больше не полностью зависимыми от обновления оборудования.
1. FlashMLA: использовать GPU как 'умную конвейерную линию' для максимизации производительности
Традиционные вычисления AI напоминают ручную кухню, где множество задач требуют ручного распределения, что приводит к浪费 и ожиданию. Оптимизационное решение FlashMLA больше похоже на 'умную конвейерную линию', позволяя GPU точно планировать задачи текстов различной длины, быстро обрабатывая короткие задачи и не тратя ресурсы на длинные задачи.
- Точка прорыва: вычислительная производительность графической карты H800 была повышена до 580 TFLOPS, в то время как традиционные методы могли достичь лишь 220 TFLOPS.
- Влияние: количество необходимых GPU для аналогичных задач AI сокращено на 60%, что напрямую влияет на потребности в закупках облачных вычислительных компаний.
2. DeepEP: сделать коммуникацию GPU похожей на 'автодорогу 5G'
В обучении крупных моделей AI узким местом часто является не вычисления, а задержка в коммуникациях. DeepEP использует технологии FP8 сжатия + RDMA, что эквивалентно созданию 'автодороги 5G' между GPU, что позволяет более эффективно передавать данные.
- Данные о производительности: пропускная способность между узлами увеличена до 150 ГБ/с, задержка снижена на 83%.
- Влияние: масштаб серверных кластеров можно сократить на 40%, снизив зависимость от сетевых устройств InfiniBand от NVIDIA.
3. DeepGEMM: 'многофункциональная газовая плита' для вычислений AI
DeepGEMM оптимизировал способ матричных вычислений, что эквивалентно установке 'умной газовой плиты' на GPU, которая может динамически регулировать мощность в зависимости от различных задач.
- Увеличение эффективности: скорость вычислений при точности FP8 увеличена в 2,3 раза, потребление энергии снижено на 55%.
- Влияние на отрасль: в некоторых сценариях может заменить Tensor Core от NVIDIA, уже есть компании, которые обменяли заказы A100 на комбинацию H800 + DeepGEMM.
4. Файловая система 3FS: 'умное хранение' данных AI
Хранение данных является ключевым для обучения AI, а файловая система 3FS похожа на 'автоматизированный склад', способный мгновенно извлекать огромные объемы данных, а не искать файлы вручную, как это делается традиционными методами.
- Пропускная способность: скорость чтения и записи 6,6 ТБ/с, что в 12 раз быстрее файловой системы Lustre.
- Влияние: время предобработки обучающих данных сокращено на 70%, снижена потребность в инвестициях в GPU на 35%.
5. 'Эффект снежного кома' открытой экосистемы
Стратегия открытого кода DeepSeek похожа на снежный ком, который становится все больше. Данные GitHub показывают, что недельный объем загрузок их открытой библиотеки превысил 1,2 миллиона раз, при этом 30% поступило от разработчиков из Европы и США. Это означает, что разработчики по всему миру быстро адаптируют эти оптимизационные решения, тем самым ослабляя контроль NVIDIA над программной экосистемой.
От 'накопления чипов' до 'вырезания кода': переосмысление ландшафта AI-индустрии
В последние годы логика развития вычислительных мощностей AI была 'технология чипов определяет все', но неделя открытого кода DeepSeek показала, что оптимизация на уровне программного обеспечения может обеспечить экспоненциальное улучшение без обновления оборудования. Это начало менять логику оценки всей AI-индустрии.
- Дилемма NVIDIA: компания инвестировала более 12 миллиардов долларов в разработку GPU с архитектурой Blackwell, но закрытая экосистема CUDA стала 'проблемой, запирающей клиентов', что привело к тому, что расходы на программную оптимизацию в бюджете AI компаний, таких как Meta и Microsoft, увеличились с 15% до 40% к 2025 году.
- Восходящие силы: оценка материнской компании DeepSeek за три месяца увеличилась на 300%, достигнув 72 миллиардов долларов, превзойдя Stability AI.
- Выбор разработчиков по всему миру: статистика GitHub показывает, что доля проектов AI, использующих компоненты DeepSeek, достигла 27%, превысив PyTorch Lightning.
NVIDIA слишком велика, чтобы упасть? Как фондовый рынок США справится с этой негативной новостью?
Падение акций NVIDIA - это не просто буря в индустрии AI, это также затрагивает стабильность всего рынка акций США. Как лидер по капитализации в секторе технологий, каждый резкий колебание акций NVIDIA вызывает цепную реакцию на рынке. Как же рынку США справиться с этой негативной новостью?
- В краткосрочной перспективе рынок может пережить период оттока средств в безопасные активы и коррекции в секторе технологий, особенно в процессе переоценки стоимости AI-индустрии.
- В среднесрочной и долгосрочной перспективе NVIDIA по-прежнему останется важным столпом AI-индустрии. Хотя программная оптимизация ставит под сомнение логику обновления оборудования, GPU по-прежнему являются основой обучения и вывода больших моделей. Как только рынок восстановит доверие, NVIDIA все еще сможет восстановить свои позиции.
- Восстановление рынка биткойнов, возможно, зависит от стабильности фондового рынка США. Как только давление продажи на акции технологий ослабнет, риск-аппетит на рынке возобновится, ликвидность вернется, и биткойн, как 'цифровое золото', сможет рассчитывать на восстановление.
Будущий мир AI больше не будет просто соревнованием оборудования, это эпоха вычислительных мощностей, определяемых программным обеспечением. В эту эпоху компании, способные 'превращать камни в золото' с помощью кода, будут идти дальше, чем те, кто сосредоточен на создании все более крупных молотов.
Неделя открытого кода DeepSeek - это только начало, новая архитектура вычислительных мощностей AI тихо переосмысляет мир.