Meta* представила Llama 4: что это за зверь и почему о нём спорят даже учёные

8 апреля8 апр

5 мин

Оглавление

Что за Llama и почему сразу четвёртая?
Три новых модели: Scout, Maverick и Behemoth
Llama 4 Scout — скромная, но шустрая

В мире искусственного интеллекта давно не было такого оживления. Пока одни обсуждают, сможет ли GPT-5 появиться этим летом, другие — уже вовсю тестируют новую серию языковых моделей от компании Meta*. Да-да, той самой, которая делает Instagram, WhatsApp и VR-шлемы, а теперь решила показать зубы и в ИИ-гонке. И зубы эти — модели Llama 4, свежие, блестящие и с претензией на доминирование в стаде нейросетей.

Если у вас в голове до сих пор «llama» ассоциируется с пушистым альпакоподобным созданием из Перу — забудьте. В 2025 году это уже бренд нейросетей от Meta*, и теперь он стал мощнее, быстрее и… скандальнее.

Что за Llama и почему сразу четвёртая?

Начнём с базы: LLaMA расшифровывается как Large Language Model Meta AI. Первая версия этой модели была представлена в 2023 году и наделала шуму в open-source-сообществе. Meta* решила: а почему бы не выпустить свою ИИ-модель в открытый доступ, пока OpenAI и Google держат всё за семью API?

Спойлер: так и началась эпоха open LLM. Llama 2 уже активно использовалась во многих продуктах, включая Microsoft Copilot. Но теперь на сцену выходит Llama 4, и выходит уверенно, с целым табуном.

Три новых модели: Scout, Maverick и Behemoth

Meta* решила не мелочиться и выпустила сразу три варианта Llama 4:

Scout — лёгкая, как утренняя пробежка.
Maverick — та самая “золотая середина”.
Behemoth — кибергорилла в мире нейросетей, но пока ещё в тренировке.

Каждая модель построена на архитектуре Mixture of Experts. Это как если бы у вас была команда из 100 специалистов, но вы на каждую задачу привлекали только 4–8 нужных. Экономия ресурсов и скорость работы — уровень бог.

Llama 4 Scout — скромная, но шустрая

Первая модель в линейке — Scout, активирует 17 миллиардов параметров из общей архитектуры в 109 миллиардов. Звучит как много, но на самом деле она может работать даже на одном GPU Nvidia H100. А теперь держитесь за кресло — контекстное окно до 10 миллионов токенов. Это как если бы вы могли загрузить в неё всю «Войну и мир», комментарии к ней, все ваши переписки в WhatsApp и она бы сказала: «Ну и что, продолжаем».

Scout — идеальна для стартапов и небольших проектов, где важна производительность, но нет миллиардов долларов на серверы. Умна, быстра и не требует целого дата-центра.

Llama 4 Maverick — дерзкий середняк

Название Maverick намекает: «Я не такой, как все». И правда. Эта модель также активирует 17B параметров, но уже из 400 миллиардов. Внутри — 128 экспертов, что делает её куда более продвинутой, чем Scout.

Meta* уверяет, что Maverick обгоняет GPT-4o, Claude 3 Sonnet и Gemini 1.5 Flash в задачах reasoning, математики и программирования. В бенчмарках она действительно показывает отличные результаты. Но тут всё не так просто — об этом поговорим чуть позже.

Llama 4 Behemoth — огромный, но пока в тени

Третья модель — Behemoth, пока что остаётся загадкой. Meta* сообщила, что она находится в процессе обучения, но уже ясно: это будет монстр. 288 миллиардов активных параметров, около 2 триллионов в общей архитектуре. Это как собрать все нейросети в одном гигантском мозгу и включить режим «бог».

Meta* явно хочет, чтобы Behemoth стал тем самым «сверхразумом» на рынке LLM — но пока мы можем только ждать и гадать.

Где будут использовать Llama 4: не только в играх гиков

Meta* — это не лаборатория в подвале, это империя социальных сетей. Поэтому неудивительно, что Llama 4 уже запланирована для интеграции в повседневные продукты: WhatsApp, Instagram, Messenger и даже в шлемы Quest.

Представьте, что в мессенджере вы не просто переписываетесь, а получаете персонального помощника на базе Llama 4, который понимает контекст, тональность, умеет находить нужную информацию и даже обрабатывать голос или изображение.

И да, Llama 4 — мультимодальная. Она способна работать не только с текстом, но и с изображениями, видео и аудио. Это значит, что нейросеть сможет распознавать фото, анализировать видеоролики, реагировать на голосовые сообщения и давать вменяемые ответы в реальном времени. Короче, если вы думали, что чат-бот — это только текст, пора пересматривать взгляд на жизнь.

Open-source и разработчики: можно ли «пощупать» Llama 4?

Meta* продолжает придерживаться своей open-source-стратегии. Некоторые версии Llama 4 (например, Scout) уже доступны на платформах вроде HuggingFace и AWS. Это значит, что разработчики могут подключаться к этим моделям, тестировать, дообучать, интегрировать в свои проекты.

Но — важное уточнение: не все модели доступны в полном объёме. Maverick и особенно Behemoth — пока закрытые для большинства пользователей. Это, с одной стороны, логично (безопасность и ресурсы), но с другой — немного рушит образ «всё для народа».

Скандал с тестами Maverick: не всё так прозрачно

И вот тут начинается драма. Если бы была нейросетевая премия «Оскар за лучший скандал года» — Maverick явно попала бы в номинацию.

Некоторые исследователи обратили внимание, что в официальных тестах (бенчмарках) Meta* использовала кастомную версию Maverick, которая не соответствует той, что доступна общественности. Проще говоря: в бенчмарках модель показала суперкласс, а в реальной жизни — чуть менее звездные результаты.

Meta* оправдывается: дескать, это обычная практика — тестировать доработанные варианты. Но у сообщества на это своя реакция: «Почему не предупредили заранее?»

Это не просто капля дегтя. В мире ИИ прозрачность тестирования — ключ к доверию. И когда гигант вроде Meta* играет в затемнение — это вызывает вопросы.

Что говорят об Llama 4 конкуренты и эксперты

Сравнение с конкурентами — вещь щекотливая, но мы ж не ради рекламы тут. Мнения в индустрии примерно такие:

GPT-4 от OpenAI всё ещё считается эталоном «умного текста» — особенно в генерации, логике и тонких смыслах.
Claude 3 от Anthropic выигрывает по этичности и аккуратности ответов.
Gemini 1.5 Flash от Google — скорость и удобство для мультимодальных задач.

Но Maverick реально впечатляет по скорости и глубине reasoning. У Scout огромный потенциал для задач с длинной памятью (10 млн токенов — это практически вечность для модели). А Behemoth… ну, ждём его в будущем фильме «Терминатор: Пробуждение Llama».

Заключение: это прорыв или просто апгрейд?

Серия Llama 4 — это не революция, но и далеко не рядовое обновление. Meta* показала:

что умеет делать модели на уровне топ-конкурентов;
что может масштабировать решения до мультимодальных гигантов;
и что всё это может быть доступно не только крупным корпорациям, но и энтузиастам.

Пока что на практике Llama 4 — это сильный вызов OpenAI и Google. Если Meta* продолжит в том же духе (а судя по $65 млрд инвестиций в ИИ в 2025 году — продолжит), то нас ждёт интересный год. И кто знает, может, ваш следующий цифровой помощник будет вовсе не ChatGPT, а пушистая — точнее, кибернетическая — лама от Meta*.

*Запрещенная в России организация.