больших моделей искусственного интеллекта и увеличение скорости на 60–85 % 27 июня IT House сообщила, что сегодня DeepSeek и Пекинский университет официально выпустили среду ускорения вывода DSpark, призванную устранить узкое место в эффективности вывода больших языковых моделей в производственных средах с высоким уровнем параллелизма. Эта платформа была развернута в предварительных версиях сервисных модулей DeepSeek-V4-Flash и DeepSeek-V4-Pro. По сравнению с базовым вариантом спекулятивного декодирования одного токена MTP-1, использовавшимся в предыдущей производственной среде, он может увеличить скорость однопользовательской генерации на 60–85 % при том же уровне... Подписывайтесь на t.me/chinese_ai_news и dzen.ru/chinese_ai
Пекинский университет и DeepSeek совместно используют DSpark с открытым исходным кодом: устранение узкого места высокопараллельного вывода
СегодняСегодня
~1 мин