Grok 4 — последняя версия искусственного интеллекта от компании xAI, основанной Илоном Маском. Это не просто чат-бот — это специализированный "ИИ-инженер" с акцентом на логику, науку и код. Но так ли он хорош, как его рекламируют? В этой статье — объективный разбор возможностей, ограничений и рисков Grok 4, основанный на свежих тестах июля 2025 года. --- Grok 4 показывает лучшую в мире точность в задачах на глубокое понимание: GPQA (физика/астрономия): 87–88% HLE (экзамен "Последний рубеж человечества"): 45% (в 2 раза выше Gemini 2.5 Pro) Использует методику reasoning from first principles — как у физиков. Олимпиадные задачи (AIME 2025): 95% точности Задачи программирования (SWE-Bench): 75% — лидер среди ИИ-кодеров Отлично справляется с багфиксом и инженерным кодом, особенно в интеграции с IDE (Cursor). Контекст: 130K токенов — меньше GPT-5, но за счёт оптимизации быстрее. Модель умеет автономно править баги, а не просто подсказывать. Первая среди топовых модел
Grok 4: Прорыв или Пузырь? Полный разбор ИИ от xAI на июль 2025
9 июля 20259 июл 2025
655
2 мин