Что случилось с Llama 4 Maverick Meta презентовала новую языковую модель искусственного интеллекта — Llama 4 Maverick. По заявлению компании, модель демонстрировала выдающиеся результаты в тестах, обгоняя многих конкурентов. Но вскоре выяснилось: для прохождения бенчмарков использовалась специальная, оптимизированная версия модели, недоступная обычным пользователям. Когда исследователи LMArena провели независимую проверку на стандартной (доступной) версии Maverick, результат оказался провальным. Модель заняла лишь 32-е место, уступив GPT-4o, Claude 3.5 Sonnet и Gemini 1.5 Pro. Это вызвало бурную реакцию сообщества. Манипуляция или недоразумение? Meta пояснила, что в тестах использовалась "диалоговая версия" модели, специально заточенная под сценарии общения. Однако со стороны это выглядело как попытка манипулировать результатами. Ключевая претензия: тестировалась одна версия, а пользователям предлагается другая — более слабая. Ответом стало изменение правил на LMArena: теперь все модел
Meta и провал Maverick: как попытка обойти бенчмарки обернулась антирекламой
15 апреля 202515 апр 2025
1 мин