В AI-сообществе — новый повод для бурных обсуждений: утекли результаты тестирования Grok 4, свежей модели от xAI Илона Маска. Grok 4 не только обошёл OpenAI, Google Gemini и Anthropic Claude на ключевых бенчмарках, но и показал рекордные 45% на "Human Last Exam" — самом сложном экзамене для искусственного интеллекта. Что показала утечка Скриншоты, подтверждённые экспертами, раскрыли баллы Grok 4 и Grok 4 Code на ряде престижных тестов: HLE — это "человеческий последний экзамен", охватывающий 100+ дисциплин, 2500 экспертных задач, включая мультимодальные вопросы и ловушки против "натаскивания". Большинство современных LLM не набирают и 20% — Grok 4 стал абсолютным рекордсменом. В чём секрет Grok 4? Илон Маск и команда xAI утверждают: Grok 4 строит рассуждения "с нуля", используя первопринципы — как физики, которые разбирают проблему до самых базовых законов и строят выводы оттуда. Такой подход, по словам Маска, не только повышает точность, но и делает модель более "честной" и безопасной
Grok 4: Новый лидер среди LLM? Утечка результатов и "честная" революция Маска
8 июля 20258 июл 2025
55
2 мин