Найти в Дзене
ИИ на Пальцах

🥉Grok-4 не дотянул до вершины? В рейтинге LMArena, где пользователи анонимно оценивают ответы ИИ, новая модель Grok-4 от xAI Илона Маска

🥉Grok-4 не дотянул до вершины? В рейтинге LMArena, где пользователи анонимно оценивают ответы ИИ, новая модель Grok-4 от xAI Илона Маска заняла третью позицию, уступив Gemini 2.5 Pro, OpenAI o3 и GPT-4o, но оказавшись на одном уровне с GPT-4.5. Хотя Grok-4 показал отличные результаты в бенчмарках, он блистал только в математических задачах. В программировании, сложных запросах, научных темах и креативности модель не смогла обойти лидеров от Google и OpenAI. В веб-разработке Grok-4 и вовсе оказался на 12-м месте. Интересно, что без системного промпта xAI модель набрала 1433 балла, а с ним — лишь 1422. NeuroFlux #ИИ #Grok4 #LMArena #Нейросети

🥉Grok-4 не дотянул до вершины? В рейтинге LMArena, где пользователи анонимно оценивают ответы ИИ, новая модель Grok-4 от xAI Илона Маска заняла третью позицию, уступив Gemini 2.5 Pro, OpenAI o3 и GPT-4o, но оказавшись на одном уровне с GPT-4.5.

Хотя Grok-4 показал отличные результаты в бенчмарках, он блистал только в математических задачах. В программировании, сложных запросах, научных темах и креативности модель не смогла обойти лидеров от Google и OpenAI. В веб-разработке Grok-4 и вовсе оказался на 12-м месте.

Интересно, что без системного промпта xAI модель набрала 1433 балла, а с ним — лишь 1422.

NeuroFlux

#ИИ #Grok4 #LMArena #Нейросети

-2
-3