☄️ Вчера выкатили семейство открытых моделей Llama 4 И они бьют все рекорды по мощности, мультимодальности и доступности. Вот главные фишки: ✔️ Три модели на любой вкус 1. Llama 4 Scout (17 млрд активных параметров): - Контекст 10 млн токенов (в 50 раз больше конкурентов!). - Работает на одной GPU H100. - Лучшая в классе для текста, изображений и видео. 2. Llama 4 Maverick (17 млрд активных параметров): - Конкурирует с GPT-4o и Gemini 2.0. - Топ в кодировании (LiveCodeBench: 43.4) и рассуждениях (MMLU Pro: 80.5). 3. Llama 4 Behemoth (288 млрд активных параметров): - Почти 2 трлн параметров в общей сложности. - Обходит GPT-4.5 и Claude в STEM-задачах (MATH-500: 95.0!). - Пока в разработке, но уже впечатляет. ✔️ Под капотом MoE-архитектура (микстура из экспертов) Экономит ресурсы — каждый токен обрабатывается частью модели. - Нативная мультимодальность: Текст + изображения + видео в одной модели. - 10 млн токенов контекста: Благодаря iRoPE и оптимизации внимания. - Обучение: FP8-prec
☄️ Вчера выкатили семейство открытых моделей Llama 4
6 апреля 20256 апр 2025
1
1 мин