В декабре 2025 года команда Ant Group совместно с ведущими китайскими университетами представила LLaDA2.0 — первый диффузионный языковой модель (dLLM) с масштабом 100B параметров. Это важнейший рубеж для альтернативы автогрессивным (AR) моделям, которые до сих пор доминировали в генерации текста. В чём суть и новизна? Диффузионные языковые модели (dLLM) — это новый подход, где текст генерируется не по одному токену слева направо, а параллельно и с возможностью корректировки уже сгенерированных фрагментов. Это позволяет лучше учитывать двусторонние зависимости и исправлять ошибки “на лету”. LLaDA2.0-flash — первый dLLM с 100 млрд параметров, построенный на архитектуре MoE (Mixture of Experts). В тестах на 47 бенчмарках модель показала средний балл 73.18, сравнимый с лучшими AR-моделями (например, Qwen3-30B-A3B-Instruct-2507). Особенно сильна в задачах программирования, сложного планирования и агентных сценариях. Ключевые технические р
LLaDA2.0: первый в мире диффузионный языковой модель с 100 млрд параметров
12 декабря 202512 дек 2025
1
3 мин