Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

Отличные новости для xAI: Grok теперь неплохо отвечает на вопросы о Baldur’s Gate

Новый отчет Business Insider раскрывает, что высокопоставленных инженеров xAI отвлекали от других проектов, чтобы убедиться, что Grok сможет отвечать на подробные вопросы по видеоигре «Baldur’s Gate». — techcrunch.com У разных AI-лабораторий разные приоритеты. OpenAI традиционно фокусируется на обычных пользователях, в то время как конкурент Anthropic ориентируется на корпоративных клиентов. Как мы недавно выяснили, xAI Илона Маска уделяет особое внимание прохождениям видеоигр. В пятницу Грейс Кей из Business Insider опубликовала подробный и обширный отчет о xAI — стартапе в области ИИ, недавно приобретенном SpaceX, с особым акцентом на то, как Маск усложняет жизнь сотрудникам. Но этот анекдот особенно выделяется: В прошлом году выпуск модели был задержан на несколько дней, потому что Маск был недоволен тем, как чат-бот отвечал на подробные вопросы по видеоигре «Baldur’s Gate», согласно источникам, знакомым с ситуацией. Ведущие инженеры были отвлечены от других проектов, чтобы улучшить

Новый отчет Business Insider раскрывает, что высокопоставленных инженеров xAI отвлекали от других проектов, чтобы убедиться, что Grok сможет отвечать на подробные вопросы по видеоигре «Baldur’s Gate». — techcrunch.com

У разных AI-лабораторий разные приоритеты. OpenAI традиционно фокусируется на обычных пользователях, в то время как конкурент Anthropic ориентируется на корпоративных клиентов. Как мы недавно выяснили, xAI Илона Маска уделяет особое внимание прохождениям видеоигр.

В пятницу Грейс Кей из Business Insider опубликовала подробный и обширный отчет о xAI — стартапе в области ИИ, недавно приобретенном SpaceX, с особым акцентом на то, как Маск усложняет жизнь сотрудникам. Но этот анекдот особенно выделяется:

В прошлом году выпуск модели был задержан на несколько дней, потому что Маск был недоволен тем, как чат-бот отвечал на подробные вопросы по видеоигре «Baldur’s Gate», согласно источникам, знакомым с ситуацией. Ведущие инженеры были отвлечены от других проектов, чтобы улучшить ответы перед запуском, сообщили они.

Конечно, можно представить разочарование любого уважаемого и опытного инженера, который приходит на работу, думая, что будет решать фундаментальные проблемы знаний и машинного интеллекта, только чтобы отвлечься на помощь 54-летнему мужчине в прохождении его видеоигры. Но этот анекдот поднимает еще более насущный вопрос: добился ли Маск желаемых игровых навыков?

Чтобы ответить на этот вопрос, наш штатный энтузиаст RPG Рам Айер подготовил набор из пяти общих вопросов по Baldur’s Gate, которые мы протестировали на xAI и трех основных моделях в своего рода квази-бенчмарке, который я решил назвать BaldurBench.

В интересах журналистской прозрачности я сделал все стенограммы чатов общедоступными, так что вы можете ознакомиться с ними здесь: Grok, ChatGPT, Claude и Gemini.

Во-первых, хорошие новости: Grok действительно дает неплохую информацию. Его ответы были немного перегружены игровым жаргоном — «save-scumming» вместо сохранения и «DPS» вместо урона — но ответы были полезными и хорошо информированными, при условии, что вы понимали, о чем идет речь. Grok также очень любит таблицы и теоретические расчеты, что вполне ожидаемо.

Существует множество руководств по Baldur’s Gate, и модели в целом черпали из одних и тех же источников, поэтому наибольшие различия были стилистическими. ChatGPT предпочитает маркированные списки и фрагменты предложений, в то время как Gemini любит выделять важные слова жирным шрифтом.

Самым большим сюрпризом стал Claude, который особенно беспокоился о том, чтобы не испортить мне игровой опыт. Когда я спросил о хороших состава партий, он завершил руководство фразой «не слишком напрягайся и просто выбирай то, что тебе кажется забавным». Спасибо, Claude!

Важно помнить, что это область, на достижение паритета в которой, как мы знаем (благодаря отчетам Business Insider), xAI специально сосредоточилась. Поэтому не стоит придавать слишком большого значения тому факту, что после заявленного спринта советы Grok оказались примерно такими же, как у других моделей. Тем не менее, приятно знать, что xAI может добиться успеха, если постарается.

Loading the player…

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Russell Brandom

Оригинал статьи