Найти в Дзене
Электромозг

Разгадка эффективности DeepSeek-R1

На днях в китайском издании «South China Morning Post» была опубликована статья о достижении китайской группы учёных в направлении более эффективного использования чипов NVidia. Возможно, именно эти исследования сделали возможными достижения Китая в искусственном интеллекте: Статья была широко растиражирована в российском медиапространстве в некорректном переводе, точнее, с безоговорочными домыслами, которых нет в первоисточнике. Китайцы нигде не упоминают, что в работах принимали участие российские учёные, но наши СМИ везде об этом радостно сообщают на том основании, что сам университет московско-пекинский. Нет, в первоисточнике всего дишь написано, что разработка проведена «исследовательской группой из Шэньчжэньского университета МГУ-ППИ, соучредителями которого являются Московский государственный университет имени М. В. Ломоносова и Пекинский политехнический институт... ...Yang Yang, доцент, использовала технологию программирования CUDA от Nvidia для создания фреймворка PD-General.
Оглавление

На днях в китайском издании «South China Morning Post» была опубликована статья о достижении китайской группы учёных в направлении более эффективного использования чипов NVidia. Возможно, именно эти исследования сделали возможными достижения Китая в искусственном интеллекте:

Chinese algorithm boosts Nvidia GPU performance 800-fold in science computing

Статья была широко растиражирована в российском медиапространстве в некорректном переводе, точнее, с безоговорочными домыслами, которых нет в первоисточнике. Китайцы нигде не упоминают, что в работах принимали участие российские учёные, но наши СМИ везде об этом радостно сообщают на том основании, что сам университет московско-пекинский.

Нет, в первоисточнике всего дишь написано, что разработка проведена «исследовательской группой из Шэньчжэньского университета МГУ-ППИ, соучредителями которого являются Московский государственный университет имени М. В. Ломоносова и Пекинский политехнический институт... ...Yang Yang, доцент, использовала технологию программирования CUDA от Nvidia для создания фреймворка PD-General. Проведя глубокий анализ уникальной структуры чипа, её команда оптимизировала разработку алгоритмов и управление памятью, что привело к значительному повышению производительности. Их исследование было опубликовано в Китайском журнале вычислительной механики 8 января.»

Ни о какой совместной русско-китайской команде в первоисточнике не было ни слова. Возможно, дополнительную информацию об авторах оптимизации можно почерпнуть из исследования, опубликованного в журнале вычислительной механики, но на сайте журнала свежие номера не выкладываются. В открытом доступе я это исследование не нашёл.

Что сообщается в статье?

Китайский алгоритм повышает производительность графического процессора Nvidia в научных вычислениях в 800 раз. Прорыв, совершённый китайскими исследователями, может помочь в решении сложных задач в таких отраслях, как аэрокосмическая, военное дело и проектирование мостов.

Китайские исследователи разработали высокопроизводительный алгоритм, который может решать сложные задачи по проектированию материалов на потребительских графических процессорах, обеспечивая революционное 800-кратное увеличение скорости по сравнению с традиционными методами.

Новый алгоритм, разработанный исследовательской группой из Шэньчжэньского университета МГУ-ППИ, соучредителями которого являются Московский государственный университет имени М. В. Ломоносова и Пекинский политехнический институт, повышает эффективность вычислений в перидинамике (PD) — передовой нелокальной теории, которая решает сложные физические задачи, такие как трещины, повреждения и переломы.

Это открывает новые возможности для решения сложных механических задач в различных отраслях, включая аэрокосмическую и военную сферы, с помощью широкодоступных недорогих микросхем, на которые не распространяются санкции США.

Перидинамика оказалась полезной при моделировании повреждений материалов, но из-за высокой вычислительной сложности крупномасштабные симуляции традиционно были неэффективными из-за таких проблем, как высокая загрузка памяти и низкая скорость обработки.

Чтобы решить эти проблемы, Ян Ян, доцент, использовала технологию программирования CUDA от Nvidia для создания фреймворка PD-General. Проведя глубокий анализ уникальной структуры чипа (реверс-инжиниринг), её команда оптимизировала разработку алгоритмов и управление памятью, что привело к значительному повышению производительности. Их исследование было опубликовано в Китайском журнале вычислительной механики 8 января.

«Эта эффективная вычислительная мощность позволяет исследователям сократить вычисления, которые обычно занимают несколько дней, до нескольких часов — или даже минут — с помощью обычного графического процессора домашнего уровня, что является значительным достижением для исследований болезни Паркинсона», — написала Ян в статье.

Что из всего этого следует?

Во-первых, журналистам надо быть более осторожными и объективными, чтобы не формировать у читателей устойчивого недоверия к их информации, которого уже слишком много.

Во-вторых, очевидно, что в Китае проведено глубокое исследование аппаратных возможностей чипов NVidia, на основании чего удалось создать более эффективные библиотеки для специальных применений. Очевидно, эти же знания позволили создать более оптимальные библиотеки и для работы искусственного интеллекта, так что неудивительно, что появилась модель DeepSeek-R1.

В-третьих, поскольку сам институт, в котором проводились исследования, российско-китайский, то вся конкретика по этим проектам может быть доступна и российской стороне, включая архитектурные особенности чипов NVidia. Это может помочь нам в разработке своих чипов, об одном их которых я недавно писал в статье «НТЦ «Модуль» против NVidia. На подходе новый микропроцессор для российских нейронок!».

Заключение

Если кому удастся заполучить публикацию исследования (Journal of Computational Mechanics от 8 января 2025 года), поделитесь, пожалуйста ссылочкой или посмотрите, есть ли среди авторов наши исследователи? Просто интересно.

На сегодня всё. Ставьте нравлики, делитесь своим мнением в комментариях и подпишитесь на мой канал, если вы не сделали этого ранее :-) Удачи!