В июне 2025 года исследователи из Корнелла, CMU и других ведущих институтов представили Eso-LM — первую в мире языковую модель, которая объединяет диффузионные и автогрессивные подходы, обеспечивая беспрецедентный прирост скорости генерации текста. По словам авторов, Eso-LM генерирует текст до 65 раз быстрее стандартных диффузионных моделей и в 3–4 раза быстрее лучших гибридных решений с поддержкой KV-кэширования. На это уже обратили внимание такие гиганты, как NVIDIA. Диффузия встречает автогрессию: что это значит? Традиционные языковые модели строятся по автогрессивному принципу: каждое следующее слово предсказывается на основе уже сгенерированных. Диффузионные модели, наоборот, начинают с зашумленного (частично замаскированного) текста и постепенно «очищают» его, восстанавливая исходную последовательность. У каждого подхода есть свои плюсы и минусы: автогрессия быстрая благодаря KV-кэшированию, но не может генерировать токены параллельно; диффузия поддерживает параллелизм, но обычно
Eso-LM: Революция в языковом моделировании — гибрид диффузии и автогрессии ускоряет генерацию в 65 раз
16 июня16 июн
3
3 мин