Пекинский университет и DeepSeek совместно используют DSpark с открытым исходным кодом: устранение узкого места высокопараллельного вывода

СегодняСегодня

~1 мин

больших моделей искусственного интеллекта и увеличение скорости на 60–85 % 27 июня IT House сообщила, что сегодня DeepSeek и Пекинский университет официально выпустили среду ускорения вывода DSpark, призванную устранить узкое место в эффективности вывода больших языковых моделей в производственных средах с высоким уровнем параллелизма. Эта платформа была развернута в предварительных версиях сервисных модулей DeepSeek-V4-Flash и DeepSeek-V4-Pro. По сравнению с базовым вариантом спекулятивного декодирования одного токена MTP-1, использовавшимся в предыдущей производственной среде, он может увеличить скорость однопользовательской генерации на 60–85 % при том же уровне... Подписывайтесь на t.me/chinese_ai_news и dzen.ru/chinese_ai

Пекинский университет и DeepSeek совместно используют DSpark с открытым исходным кодом: устранение узкого места высокопараллельного вывода больших моделей искусственного интеллекта и увеличение скорости на 60–85 %

27 июня IT House сообщила, что сегодня DeepSeek и Пекинский университет официально выпустили среду ускорения вывода DSpark, призванную устранить узкое место в эффективности вывода больших языковых моделей в производственных средах с высоким уровнем параллелизма.

Эта платформа была развернута в предварительных версиях сервисных модулей DeepSeek-V4-Flash и DeepSeek-V4-Pro. По сравнению с базовым вариантом спекулятивного декодирования одного токена MTP-1, использовавшимся в предыдущей производственной среде, он может увеличить скорость однопользовательской генерации на 60–85 % при том же уровне...

Подписывайтесь на t.me/chinese_ai_news и dzen.ru/chinese_ai