За счет того, что ответы генерируются не токен за токеном, а целиком из «белого шума» (как картинки) скорость диффузионных LLM почти недостижима для обычных моделей — только со скоростными чипами вроде Cerebras. Так Mercury 2 за несколько секунд написала компьютерные шахматы Попробовать модель можно бесплатно на сайте. К слову, свою экспериментальную диффузионную LLM в прошлом году даже показывал Google, но о широком релизе новостей так и не появилось. У диффузионных LLM есть будущее? 🔥 — да, это мощь! 🤔 — вряд ли, скорее игрушка
Mercury 2 — первая диффузионная LLM уровня GPT-5 mini/Claude Haiku 4.5, но в 5-7 раз быстрее
17 марта17 мар
~1 мин