Добавить в корзинуПозвонить
Найти в Дзене

⚡⚡ Command A+ от Cohere: open source модель для enterprise, выросла в агентных задачах (37%→85%) и встает на 2×H100

Производительность Cohere в агентных задачах взлетела с 37% до 85% — и теперь мощная модель Command A+ доступна как open source. Command A+ весит 218B параметров, из них при ответе активируется 25B — это MoE (активирует часть параметров). Модель выложили под Apache 2.0: можно скачать веса, модифицировать и запускать у себя. Самый неожиданный момент — развёртывание: заявлено, что при W4A4 квантизации Command A+ помещается на 2×H100 (или на 1×B200). Квантизация сделана избирательно: эксперты уходят в 4 бита, а attention-путь (Q/K/V/O и KV cache) остаётся в полной точности. Для сценариев enterprise есть tool use и мультимодальность: текст+изображения, 48 языков и 128K контекст. Модель также объединяет прежние ветки семейства (Reasoning/Vision/Translate) в одну. #release #Cohere #CommandAplus #MoE #quantization #vLLM #tooluse #enterprise 🔗 Cohere open-sources its strongest model yet

⚡⚡ Command A+ от Cohere: open source модель для enterprise, выросла в агентных задачах (37%→85%) и встает на 2×H100

Производительность Cohere в агентных задачах взлетела с 37% до 85% — и теперь мощная модель Command A+ доступна как open source.

Command A+ весит 218B параметров, из них при ответе активируется 25B — это MoE (активирует часть параметров). Модель выложили под Apache 2.0: можно скачать веса, модифицировать и запускать у себя.

Самый неожиданный момент — развёртывание: заявлено, что при W4A4 квантизации Command A+ помещается на 2×H100 (или на 1×B200). Квантизация сделана избирательно: эксперты уходят в 4 бита, а attention-путь (Q/K/V/O и KV cache) остаётся в полной точности.

Для сценариев enterprise есть tool use и мультимодальность: текст+изображения, 48 языков и 128K контекст. Модель также объединяет прежние ветки семейства (Reasoning/Vision/Translate) в одну.

#release #Cohere #CommandAplus #MoE #quantization #vLLM #tooluse #enterprise

🔗 Cohere open-sources its strongest model yet