137 подписчиков

🥉Grok-4 не дотянул до вершины? В рейтинге LMArena, где пользователи анонимно оценивают ответы ИИ, новая модель Grok-4 от xAI Илона Маска

17 июля 202517 июл 2025

~1 мин

🥉Grok-4 не дотянул до вершины? В рейтинге LMArena, где пользователи анонимно оценивают ответы ИИ, новая модель Grok-4 от xAI Илона Маска заняла третью позицию, уступив Gemini 2.5 Pro, OpenAI o3 и GPT-4o, но оказавшись на одном уровне с GPT-4.5. Хотя Grok-4 показал отличные результаты в бенчмарках, он блистал только в математических задачах. В программировании, сложных запросах, научных темах и креативности модель не смогла обойти лидеров от Google и OpenAI. В веб-разработке Grok-4 и вовсе оказался на 12-м месте. Интересно, что без системного промпта xAI модель набрала 1433 балла, а с ним — лишь 1422. NeuroFlux #ИИ #Grok4 #LMArena #Нейросети

Хотя Grok-4 показал отличные результаты в бенчмарках, он блистал только в математических задачах. В программировании, сложных запросах, научных темах и креативности модель не смогла обойти лидеров от Google и OpenAI. В веб-разработке Grok-4 и вовсе оказался на 12-м месте.

Интересно, что без системного промпта xAI модель набрала 1433 балла, а с ним — лишь 1422.

NeuroFlux

#ИИ #Grok4 #LMArena #Нейросети