142,1 тыс подписчиков

Илон Маск утверждает, что его ИИ Grok уже находится на уровне GPT-4 и Gemini Pro 1.5

29 марта 202429 мар 2024

1 мин

Альтернатива Илона Маска на ChatGPT под названием Grok получает обновление, направленное на повышение уровня знаний чат-бота в области математики, кодирования и многого другого. Платформа искусственного интеллекта Маска, xAI, представила Grok-1.5 для ранних тестеров, которые могут похвастаться "расширенными возможностями и логическими рассуждениями", а также способностью ИИ анализировать более длинные контексты. Компания утверждает, что теперь она конкурирует с GPT-4, Gemini Pro 1.5 и Claude 3 Opus в различных областях. Согласно данным xAI, Grok-1.5 демонстрирует значительный прогресс по сравнению со своим предшественником Grok-1. В бенчмарке MATH он достиг заметных 50,6%, что более чем в два раза превышает предыдущие показатели. Более того, в тестах GSM8K и HumanEval (кодирование) она достигла 90% и 74,1% соответственно. Эти показатели практически совпадают с результатами Gemini Pro 1.5, GPT-4 и Claude 3 Opus. Примечательно, что по показателю кодирования HumanEval он превосходит всех

Согласно данным xAI, Grok-1.5 демонстрирует значительный прогресс по сравнению со своим предшественником Grok-1. В бенчмарке MATH он достиг заметных 50,6%, что более чем в два раза превышает предыдущие показатели. Более того, в тестах GSM8K и HumanEval (кодирование) она достигла 90% и 74,1% соответственно. Эти показатели практически совпадают с результатами Gemini Pro 1.5, GPT-4 и Claude 3 Opus. Примечательно, что по показателю кодирования HumanEval он превосходит всех конкурентов, кроме Claude 3 Opus.

Кроме того, Grok-1.5 теперь может работать с расширенными контекстами, содержащими до 128 тысяч лексем, что позволяет ему усваивать информацию из более широкого спектра источников для понимания сложных сценариев. Несмотря на эти улучшения, xAI не предоставила конкретной информации о достижениях Grok в других областях, оставив без ответа вопросы о его результатах в академических оценках и мультимодальных возможностях. К тому же, возможно, что успехи Grok-1.5 будут недолгими, так как летом выйдет ChatGPT 5.

В настоящее время Grok доступен исключительно для пользователей, подписанных на уровень Premium+ в X, хотя Илон Маск недавно пообещал расширить его доступность для обычных пользователей Premium.

Гаджеты и электроника

5,73 млн интересуются