39 подписчиков

Grok 4: Прорыв или Пузырь? Полный разбор ИИ от xAI на июль 2025

9 июля 20259 июл 2025

655

2 мин

Grok 4 — последняя версия искусственного интеллекта от компании xAI, основанной Илоном Маском. Это не просто чат-бот — это специализированный "ИИ-инженер" с акцентом на логику, науку и код. Но так ли он хорош, как его рекламируют? В этой статье — объективный разбор возможностей, ограничений и рисков Grok 4, основанный на свежих тестах июля 2025 года. --- Grok 4 показывает лучшую в мире точность в задачах на глубокое понимание: GPQA (физика/астрономия): 87–88% HLE (экзамен "Последний рубеж человечества"): 45% (в 2 раза выше Gemini 2.5 Pro) Использует методику reasoning from first principles — как у физиков. Олимпиадные задачи (AIME 2025): 95% точности Задачи программирования (SWE-Bench): 75% — лидер среди ИИ-кодеров Отлично справляется с багфиксом и инженерным кодом, особенно в интеграции с IDE (Cursor). Контекст: 130K токенов — меньше GPT-5, но за счёт оптимизации быстрее. Модель умеет автономно править баги, а не просто подсказывать. Первая среди топовых модел

Оглавление

🚀 Что такое Grok 4?
✅ Где Grok 4 действительно хорош
1. Научное мышление и логика

🚀 Что такое Grok 4?

В этой статье — объективный разбор возможностей, ограничений и рисков Grok 4, основанный на свежих тестах июля 2025 года.

---

✅ Где Grok 4 действительно хорош

1. Научное мышление и логика

Grok 4 показывает лучшую в мире точность в задачах на глубокое понимание:

GPQA (физика/астрономия): 87–88%

HLE (экзамен "Последний рубеж человечества"): 45% (в 2 раза выше Gemini 2.5 Pro)

Использует методику reasoning from first principles — как у физиков.

2. Математика и инженерия

Олимпиадные задачи (AIME 2025): 95% точности

Задачи программирования (SWE-Bench): 75% — лидер среди ИИ-кодеров

Отлично справляется с багфиксом и инженерным кодом, особенно в интеграции с IDE (Cursor).

3. Скорость и агентность

Контекст: 130K токенов — меньше GPT-5, но за счёт оптимизации быстрее.

Модель умеет автономно править баги, а не просто подсказывать.

4. Постоянное обновление данных

Первая среди топовых моделей с режимом Always Online:

Курсы акций, тренды, мемы, новости — в режиме реального времени.

---

⚠️ Где Grok 4 может разочаровать

1. Узкий фокус

Модель только текстовая (мультимодальность обещана позже).

В креативных задачах уступает GPT-4o и Claude 3.

2. Политическая и социальная нейтральность под вопросом

Grok 4 уже попадал в скандал с предвзятым ответом на политическую тему.

Musk продвигает антицензурную философию, но это может обернуться нейроскандалами.

3. Инфраструктура отстаёт

В отличие от OpenAI и Google, у xAI нет собственных суперкомпьютеров.

Grok 3 задерживался дважды — сдерживает рост доверия к проекту.

4. Конкуренты усиливаются

GPT-5 (также в июле 2025): 1M+ токенов, мультимодальность, универсальность.

Gemini 3.0: фокус на видеоанализе и генерации.

---

🔮 Прогноз: стоит ли ждать чудо?

---

🧠 Итого:

Grok 4 — это ИИ-инструмент нового поколения, сфокусированный на логике, инженерии и свежести данных. Он не претендует на роль "универсального собеседника", как GPT-4o или Gemini, но может стать незаменимым помощником в исследовательской, трейдерской или разработческой среде.

---

📺 Что дальше?

Сегодня вечером, 9 июля в 20:00 PT (07:00 МСК 10 июля) стартует официальный стрим с анонсом Grok 4. Ссылку можно найти на официальной странице xAI в X (Twitter).

🔁 Подписывайтесь на блог — завтра опубликуем первый обзор от независимых тестеров!