В ответ на пост 🦙 https://ai.meta.com/blog/llama-4-multimodal-intelligence/ Коротко: 1. Llama 4 Scout - 17B активных параметров, 16 экспертов, 109B общих параметров - Контекст: 10M токенов (в 80 раз больше, чем у Llama 3) - Лучшая в своём классе на задачах reasoning, long-context, coding и image understanding - Превосходит: Gemma 3, Gemini 2.0 Flash-Lite, Mistral 3.1 2. Llama 4 Maverick - 17B активных параметров, 128 экспертов, 400B общих параметров - Побеждает GPT-4o, Gemini 2.0 Flash - Сравнима с DeepSeek v3.1, но гораздо эффективнее - ELO (LMArena): 1417 — один из лучших среди открытых моделей - Заявлена как лучшая для reasoning, coding и продвинутого мультимодального взаимодействия 3. Llama 4 Behemoth (в разработке) - 288B активных параметров, 16 экспертов, ~2T общих параметров - Уже обходит GPT-4.5, Claude Sonnet 3.7, Gemini 2.0 Pro на STEM-бенчмарках - Используется как teacher-модель для Scout и Maverick. Ключевая роль в distillation и reinforcement learning