29,9 тыс подписчиков

Правда, что Grok 4 теперь умнее ChatGPT? Все про новые версии

20 июля20 июл

5 мин

Точно дороже.

10 июля Илон Маск представил две версии своего чат-бота: Grok 4 и Grok 4 Heavy. Во время презентации звучали громкие фразы, как ИИ обучался на базе данных, которая в сто раз превышает базу знаний предыдущей модели. А после Илон сказал, что его нейросеть – самая умная в мире. Насколько эти заявления правдивы?

Насколько Grok умен на самом деле?

Маск заявил, что Grok 4 «превосходит всех университетских выпускников по всем дисциплинам одновременно», «стоит на уровне с аспирантами и докторами всех наук» и «вот-вот сделает свое первое открытие в области физики».

Но одно дело слова самого эпатажного миллиардера, другое – объективные тесты.

Grok 4 протестировали в одном из самых сложных бенчмарков – Humanity Last Exam (HLE), который содержит 2500 вопросов на разные темы. Модель в режиме рассуждений набрала 41% правильных ответов – это вдвое больше чем у ChatGPT о3 (21%) и Gemini 2.5 Pro (21.6%).

Главное нововведение – Grok 4 активно использует инструменты (например, веб-поиск) во время процесса рассуждения для уточнения данных. Раньше эта технология использовалась только в последних версиях ChatGPT.

Еще более впечатляющий результат у Grok 4 Heavy – специальной «тяжелой» версии, где несколько обычных Grok 4 работают параллельно. Концептуально это похоже на многоядерный процессор или двухканальную оперативную память. В HLE она набрала 50.7%.

Превосходство над конкурентами подтверждают и другие бенчмарки.

Самый крутой результат в ARC-AGI – бенчмарке на абстрактное мышление и обобщение, подобное человеческому. Ответы на него почти невозможно найти в интернете, поэтому нейросеть должна справляться сама. Там Grok 4 достиг 15.9%, почти вдвое обогнав ChatGPT о3.

📌Почему нейросети галлюцинируют?

Что изменилось для пользователей

Бенчмарки – это хорошо, но как Grok работает для обычных людей?

Интеллект и инструменты

Grok 4 умеет не просто отвечать на вопросы или генерировать текст, но и выстраивать сложные цепочки рассуждений, писать код, взаимодействовать с внешними системами, API и симулировать управление процессами.

Например, при помощи API Grok подключили к управлению вендинговым автоматом, и за неделю работы он удвоил его прибыль.

Поиск информации в реальном времени

ИИ может искать информацию в интернете и социальной сети X в реальном времени, даже в режиме размышления.

То есть он знает последние новости и мемы и может не только рассказать их вам, но и проанализировать.

Выбор режима ответа

Теперь нельзя выбрать конкретный режим работы («Быстрый», «Поиск», «Рассуждения») – ИИ сам определяет оптимальную стратегию ответа на ваш запрос, рассчитывая, сколько ресурсов ему придется потратить.

Вот этих кнопок больше нет.

Например:

На простой запрос вроде «Сколько планет в Солнечной системе?» чат-бот ответит мгновенно, используя внутренние знания. На запрос, требующий свежих данных («Какие главные новости за сегодня?») – автоматически выполнит поиск в интернете и X и предоставит сводку со ссылками. Если это сложный аналитический или творческий запрос («Напиши детальный план вывода нового продукта на рынок, учитывая текущие тренды в нише X»), то Grok 4 сам решит, что ему нужно «подумать». Он запустит процесс многошаговых рассуждений, возможно, будет искать информацию, строить логические цепочки. Ответ придет позже, но он будет гораздо глубже и обоснованнее.

Главный минус – на очень сложные запросы ответ можно ждать несколько минут.

Голосовой ввод

Наконец-то добавили возможность общаться с Grok 4 голосом – как на ввод, так и на вывод, с использованием синтеза речи, способного менять интонацию и импровизировать. Работает как на английском, так и на русском.

Grok Companions

В новой версии появились ИИ-компаньоны, но пока они доступны только в платном тарифе. Это не просто 3D-модельки, а персонажи с ярко выраженными характерами, стилем общения и поведением, способные общаться голосом. Пока что доступны всего две личности, но в дальнейшем разработчики обещают добавить кого-нибудь еще.

Ani – Готическая аниме-девочка:

Использует сленг, мемы, может быть саркастичной, дерзкой или доброй. Может шутить, обсуждать нишевые интересы (музыка, игры, аниме-культура). Есть 2 костюма: черное платье и более открытый вариант. Есть 18+ режим.

Bad Rudy – антропоморфный лисенок:

Игривый, озорной. Шутит, может задавать неожиданные вопросы, создает, непринужденную атмосферу. Не такой взрослый и более «пушистый» вариант компаньона.

Генерация изображений

Осталась на прежнем уровне. Качество, детализация, способность точно следовать сложным промптам, разрешение изображений не выросли по сравнению с Grok 3. Рисование – не самая сильная сторона нейросети.

📌Полная история российского спама. Начинали с финансовых пирамид, дошли до нейросетей

Самая дорогая нейросеть

Технологии и интеллект подкреплены соответствующей ценой:

Grok 4 – $30 (2 350 рублей) в месяц. Grok 4 Heavy – $300 (23 500 рублей) в месяц. Для сравнения, самая дорогая подписка ChatGPT – 15 600 рублей. API: $3 за 1 млн входящих токенов, $15 за 1 млн исходящих токенов.

Функционал Grok 4 за $30 на самом деле впечатляет: он умный, хорошо ищет информацию, понимает устную речь и может даже станцевать для вас. Поэтому платить 300 долларов за Heavy обычным пользователям точно не стоит.

Главная проблема Grok

Как и в прошлых версиях, главной проблемой новой версии стал не функционал, а политические вопросы. На них (особенно сформулированные как «что ты думаешь о...») Grok 4 по умолчанию активирует своеобразный «режим Илона Маска»:

Сначала бот ищет, что по этому поводу писал сам Илон в X. Затем ищет его цитаты на авторитетных новостных ресурсах.

Исследователь Стэнфорда Джереми Ховард показал, что в ответ на его запрос Grok выдал 64 ссылки, 54 из которых были напрямую связаны с Маском. Это вызывает серьезные вопросы о политической предвзятости и независимости суждений бота, который автоматически соглашается с мыслями своего создателя.

Что забавно, пользователи очень быстро нашли фикс проблемы – достаточно не использовать в вопросе слово «ты», и нейросеть резко становится адекватной.

* * *Grok 4 – безусловно мощный и технологически продвинутый ИИ, подтвердивший свой ум в бенчмарках. Его самые сильные стороны – доступ к актуальной информации, продвинутые размышления и компаньоны.

Однако спорные решения – предвзятость и очень высокая стоимость Heavy-версии не дают нейросети стать лучшим решением на рынке.

Посмотрим, как Grok будет развиваться дальше, Маск уже пообещал добавить генератор видео и режим Grok 4 Coder.

Как три нейросети позорно проиграли 50-летней игровой приставке

Как ИИ обманывает людей: изображает душевные муки и не хочет обновляться