271 подписчик

В ответ на пост

5 апреля 20255 апр 2025

~1 мин

В ответ на пост 🦙 https://ai.meta.com/blog/llama-4-multimodal-intelligence/ Коротко: 1. Llama 4 Scout - 17B активных параметров, 16 экспертов, 109B общих параметров - Контекст: 10M токенов (в 80 раз больше, чем у Llama 3) - Лучшая в своём классе на задачах reasoning, long-context, coding и image understanding - Превосходит: Gemma 3, Gemini 2.0 Flash-Lite, Mistral 3.1 2. Llama 4 Maverick - 17B активных параметров, 128 экспертов, 400B общих параметров - Побеждает GPT-4o, Gemini 2.0 Flash - Сравнима с DeepSeek v3.1, но гораздо эффективнее - ELO (LMArena): 1417 — один из лучших среди открытых моделей - Заявлена как лучшая для reasoning, coding и продвинутого мультимодального взаимодействия 3. Llama 4 Behemoth (в разработке) - 288B активных параметров, 16 экспертов, ~2T общих параметров - Уже обходит GPT-4.5, Claude Sonnet 3.7, Gemini 2.0 Pro на STEM-бенчмарках - Используется как teacher-модель для Scout и Maverick. Ключевая роль в distillation и reinforcement learning

В ответ на пост

🦙

https://ai.meta.com/blog/llama-4-multimodal-intelligence/

Коротко:

1. Llama 4 Scout

- 17B активных параметров, 16 экспертов, 109B общих параметров

- Контекст: 10M токенов (в 80 раз больше, чем у Llama 3)

- Лучшая в своём классе на задачах reasoning, long-context, coding и image understanding

- Превосходит: Gemma 3, Gemini 2.0 Flash-Lite, Mistral 3.1

2. Llama 4 Maverick

- 17B активных параметров, 128 экспертов, 400B общих параметров

- Побеждает GPT-4o, Gemini 2.0 Flash

- Сравнима с DeepSeek v3.1, но гораздо эффективнее

- ELO (LMArena): 1417 — один из лучших среди открытых моделей

- Заявлена как лучшая для reasoning, coding и продвинутого мультимодального взаимодействия

3. Llama 4 Behemoth (в разработке)

- 288B активных параметров, 16 экспертов, ~2T общих параметров

- Уже обходит GPT-4.5, Claude Sonnet 3.7, Gemini 2.0 Pro на STEM-бенчмарках

- Используется как teacher-модель для Scout и Maverick. Ключевая роль в distillation и reinforcement learning