Добавить в корзинуПозвонить
Найти в Дзене
Аргументы и факты – aif.ru

Grok Илона Маска оказался точнее других популярных чат-ботов

Модель искусственного интеллекта Grok от компании xAI, основанной Илоном Маском, показала самый низкий уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum. В ходе исследования установлено, что уровень так называемых «галлюцинаций» у Grok составляет всего 8%, что почти в четыре раза меньше, чем у ChatGPT и Google Gemini. Для сравнения, ChatGPT показал уровень ошибок в 35%, а Gemini — 38%, что ставит под сомнение их пригодность для задач, требующих высокой точности. Оценка производилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе собранных данных каждой модели был присвоен балл по шкале от 0 до 99, где более высокие значения указывают на меньшую надежность. Grok получил итоговый балл 6, что является одним из лучших результатов в рамках этого исследования. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 б
   Grok Илона Маска оказался точнее других популярных чат-ботов
Grok Илона Маска оказался точнее других популярных чат-ботов

Модель искусственного интеллекта Grok от компании xAI, основанной Илоном Маском, показала самый низкий уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum.

В ходе исследования установлено, что уровень так называемых «галлюцинаций» у Grok составляет всего 8%, что почти в четыре раза меньше, чем у ChatGPT и Google Gemini. Для сравнения, ChatGPT показал уровень ошибок в 35%, а Gemini — 38%, что ставит под сомнение их пригодность для задач, требующих высокой точности.

Оценка производилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе собранных данных каждой модели был присвоен балл по шкале от 0 до 99, где более высокие значения указывают на меньшую надежность.

Grok получил итоговый балл 6, что является одним из лучших результатов в рамках этого исследования. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 балла, а также минимальное время простоя, составившее всего 0,07%.

В то же время ChatGPT оказался на последнем месте в рейтинге с максимальным баллом 99. На следующем уровне расположились Claude и Meta AI (которая признана экстремистской и запрещена в России) с показателями 75 и 70 соответственно. Китайский сервис DeepSeek продемонстрировал результаты, сопоставимые с Grok: уровень «галлюцинаций» составил 14%, а пользовательская оценка — 4 балла.

Напомним, что наследники 83-летней женщины из Коннектикута подали иск против OpenAI и Microsoft, утверждая, что ChatGPT стал катализатором убийства.

АиФ в MAX https://max.ru/aif

АиФ в Телеграм

Официальный канал АиФ https://t.me/aifonline

АиФ. Здоровье https://t.me/aif_health

АиФ. На даче https://t.me/aif_dacha

АиФ. Кухня https://t.me/aif_food

Вопрос-Ответ — вопросы, ответы, викторины и интересные факты обо всем на свете. https://t.me/aif_vo