Компания xAI, принадлежащая Илону Маску, представила нейросеть Grok 4. Новинка выходит спустя полгода после предшественника и приносит с собой существенный прирост по различным бенчмаркам. Особой гордостью команды разработчиков является лидирующий результат в тесте Humanity's Last Exam, что в переводе означает «Последний экзамен человечества». Это сборник из 2500 сложных заданий, в котором лучшая нейросеть 2024 года могла набрать всего около 8% решённых задач. Самая мощная версия Grok 4 – Heavy способна заработать в этом тесте результат в 44,4%. Увы, система является платной, и за её использование придётся заплатить около 300 долларов в месяц. Базовая версия Grok 4, которая может оказаться доступной для бесплатного использования, набирает в этом же тесте всего 25,4%. Однако это все равно больше, чем у прежнего лидера Humanity's Last Exam. Им, напомним, около месяца являлась модель Gemini 2.5 Pro от Google. Она набирала в тесте 21,6%. Выросли показатели Grok и на других популярных бенчм
Нейросеть Grok 4 может набирать до 44% в тесте «Последний экзамен человечества»
10 июля 202510 июл 2025
18
2 мин