Производительность Cohere в агентных задачах взлетела с 37% до 85% — и теперь мощная модель Command A+ доступна как open source. Command A+ весит 218B параметров, из них при ответе активируется 25B — это MoE (активирует часть параметров). Модель выложили под Apache 2.0: можно скачать веса, модифицировать и запускать у себя. Самый неожиданный момент — развёртывание: заявлено, что при W4A4 квантизации Command A+ помещается на 2×H100 (или на 1×B200). Квантизация сделана избирательно: эксперты уходят в 4 бита, а attention-путь (Q/K/V/O и KV cache) остаётся в полной точности. Для сценариев enterprise есть tool use и мультимодальность: текст+изображения, 48 языков и 128K контекст. Модель также объединяет прежние ветки семейства (Reasoning/Vision/Translate) в одну. #release #Cohere #CommandAplus #MoE #quantization #vLLM #tooluse #enterprise 🔗 Cohere open-sources its strongest model yet
⚡⚡ Command A+ от Cohere: open source модель для enterprise, выросла в агентных задачах (37%→85%) и встает на 2×H100
21 мая21 мая
~1 мин