В мире искусственного интеллекта давно не было такого оживления. Пока одни обсуждают, сможет ли GPT-5 появиться этим летом, другие — уже вовсю тестируют новую серию языковых моделей от компании Meta*. Да-да, той самой, которая делает Instagram, WhatsApp и VR-шлемы, а теперь решила показать зубы и в ИИ-гонке. И зубы эти — модели Llama 4, свежие, блестящие и с претензией на доминирование в стаде нейросетей.
Если у вас в голове до сих пор «llama» ассоциируется с пушистым альпакоподобным созданием из Перу — забудьте. В 2025 году это уже бренд нейросетей от Meta*, и теперь он стал мощнее, быстрее и… скандальнее.
Что за Llama и почему сразу четвёртая?
Начнём с базы: LLaMA расшифровывается как Large Language Model Meta AI. Первая версия этой модели была представлена в 2023 году и наделала шуму в open-source-сообществе. Meta* решила: а почему бы не выпустить свою ИИ-модель в открытый доступ, пока OpenAI и Google держат всё за семью API?
Спойлер: так и началась эпоха open LLM. Llama 2 уже активно использовалась во многих продуктах, включая Microsoft Copilot. Но теперь на сцену выходит Llama 4, и выходит уверенно, с целым табуном.
Три новых модели: Scout, Maverick и Behemoth
Meta* решила не мелочиться и выпустила сразу три варианта Llama 4:
- Scout — лёгкая, как утренняя пробежка.
- Maverick — та самая “золотая середина”.
- Behemoth — кибергорилла в мире нейросетей, но пока ещё в тренировке.
Каждая модель построена на архитектуре Mixture of Experts. Это как если бы у вас была команда из 100 специалистов, но вы на каждую задачу привлекали только 4–8 нужных. Экономия ресурсов и скорость работы — уровень бог.
Llama 4 Scout — скромная, но шустрая
Первая модель в линейке — Scout, активирует 17 миллиардов параметров из общей архитектуры в 109 миллиардов. Звучит как много, но на самом деле она может работать даже на одном GPU Nvidia H100. А теперь держитесь за кресло — контекстное окно до 10 миллионов токенов. Это как если бы вы могли загрузить в неё всю «Войну и мир», комментарии к ней, все ваши переписки в WhatsApp и она бы сказала: «Ну и что, продолжаем».
Scout — идеальна для стартапов и небольших проектов, где важна производительность, но нет миллиардов долларов на серверы. Умна, быстра и не требует целого дата-центра.
Llama 4 Maverick — дерзкий середняк
Название Maverick намекает: «Я не такой, как все». И правда. Эта модель также активирует 17B параметров, но уже из 400 миллиардов. Внутри — 128 экспертов, что делает её куда более продвинутой, чем Scout.
Meta* уверяет, что Maverick обгоняет GPT-4o, Claude 3 Sonnet и Gemini 1.5 Flash в задачах reasoning, математики и программирования. В бенчмарках она действительно показывает отличные результаты. Но тут всё не так просто — об этом поговорим чуть позже.
Llama 4 Behemoth — огромный, но пока в тени
Третья модель — Behemoth, пока что остаётся загадкой. Meta* сообщила, что она находится в процессе обучения, но уже ясно: это будет монстр. 288 миллиардов активных параметров, около 2 триллионов в общей архитектуре. Это как собрать все нейросети в одном гигантском мозгу и включить режим «бог».
Meta* явно хочет, чтобы Behemoth стал тем самым «сверхразумом» на рынке LLM — но пока мы можем только ждать и гадать.
Где будут использовать Llama 4: не только в играх гиков
Meta* — это не лаборатория в подвале, это империя социальных сетей. Поэтому неудивительно, что Llama 4 уже запланирована для интеграции в повседневные продукты: WhatsApp, Instagram, Messenger и даже в шлемы Quest.
Представьте, что в мессенджере вы не просто переписываетесь, а получаете персонального помощника на базе Llama 4, который понимает контекст, тональность, умеет находить нужную информацию и даже обрабатывать голос или изображение.
И да, Llama 4 — мультимодальная. Она способна работать не только с текстом, но и с изображениями, видео и аудио. Это значит, что нейросеть сможет распознавать фото, анализировать видеоролики, реагировать на голосовые сообщения и давать вменяемые ответы в реальном времени. Короче, если вы думали, что чат-бот — это только текст, пора пересматривать взгляд на жизнь.
Open-source и разработчики: можно ли «пощупать» Llama 4?
Meta* продолжает придерживаться своей open-source-стратегии. Некоторые версии Llama 4 (например, Scout) уже доступны на платформах вроде HuggingFace и AWS. Это значит, что разработчики могут подключаться к этим моделям, тестировать, дообучать, интегрировать в свои проекты.
Но — важное уточнение: не все модели доступны в полном объёме. Maverick и особенно Behemoth — пока закрытые для большинства пользователей. Это, с одной стороны, логично (безопасность и ресурсы), но с другой — немного рушит образ «всё для народа».
Скандал с тестами Maverick: не всё так прозрачно
И вот тут начинается драма. Если бы была нейросетевая премия «Оскар за лучший скандал года» — Maverick явно попала бы в номинацию.
Некоторые исследователи обратили внимание, что в официальных тестах (бенчмарках) Meta* использовала кастомную версию Maverick, которая не соответствует той, что доступна общественности. Проще говоря: в бенчмарках модель показала суперкласс, а в реальной жизни — чуть менее звездные результаты.
Meta* оправдывается: дескать, это обычная практика — тестировать доработанные варианты. Но у сообщества на это своя реакция: «Почему не предупредили заранее?»
Это не просто капля дегтя. В мире ИИ прозрачность тестирования — ключ к доверию. И когда гигант вроде Meta* играет в затемнение — это вызывает вопросы.
Что говорят об Llama 4 конкуренты и эксперты
Сравнение с конкурентами — вещь щекотливая, но мы ж не ради рекламы тут. Мнения в индустрии примерно такие:
- GPT-4 от OpenAI всё ещё считается эталоном «умного текста» — особенно в генерации, логике и тонких смыслах.
- Claude 3 от Anthropic выигрывает по этичности и аккуратности ответов.
- Gemini 1.5 Flash от Google — скорость и удобство для мультимодальных задач.
Но Maverick реально впечатляет по скорости и глубине reasoning. У Scout огромный потенциал для задач с длинной памятью (10 млн токенов — это практически вечность для модели). А Behemoth… ну, ждём его в будущем фильме «Терминатор: Пробуждение Llama».
Заключение: это прорыв или просто апгрейд?
Серия Llama 4 — это не революция, но и далеко не рядовое обновление. Meta* показала:
- что умеет делать модели на уровне топ-конкурентов;
- что может масштабировать решения до мультимодальных гигантов;
- и что всё это может быть доступно не только крупным корпорациям, но и энтузиастам.
Пока что на практике Llama 4 — это сильный вызов OpenAI и Google. Если Meta* продолжит в том же духе (а судя по $65 млрд инвестиций в ИИ в 2025 году — продолжит), то нас ждёт интересный год. И кто знает, может, ваш следующий цифровой помощник будет вовсе не ChatGPT, а пушистая — точнее, кибернетическая — лама от Meta*.
*Запрещенная в России организация.