Meta FAIR выпустила Code World Model (CWM): большая языковая модель для исследований в области генерации кода Meta FAIR выпустила Code World Model (CWM) — большую языковую модель (LLM) с 32 миллиардами параметров. Она предназначена для исследований в области генерации кода с использованием мировых моделей. Что нового? CWM обучается на двух больших семействах траекторий «наблюдение-действие»: * Трассы интерпретатора Python, которые записывают состояния локальных переменных после каждой выполненной строки. * Агентские взаимодействия внутри докеризированных репозиториев, которые фиксируют правки, командные строки и обратную связь по тестам. Это обучение предназначено для изучения семантики (как развивается состояние), а не только синтаксиса. Модель и контекстное окно CWM — это плотный трансформер (только декодер) с 64 слоями, GQA (48Q/8KV), SwiGLU, RMSNorm и Scaled RoPE. Внимание чередуется между локальными блоками 8k и глобальными блоками 131k, обеспечивая эффективный контекст в 13
Meta FAIR выпустила Code World Model (CWM): большая языковая модель для исследований в области генерации кода
25 сентября 202525 сен 2025
2 мин