Добавить в корзинуПозвонить
Найти в Дзене
О самом главном

ИИ звучит уверенно, но ошибается. ChatGPT, Gemini и Meta AI дали неправильные ответы в 50 % критических случаев, но люди им верят

Тест Which? показал, что основные чат-боты ошибаются в половине случаев, когда отвечают на вопросы о здоровье или деньгах. Meta AI показал худшие результаты, Chat GPT отстал, и даже лучшая система ошибалась в каждом третьем ответе. Беспокоит то, что пользователи доверяют без вопросов, даже когда информация может быть опасной. Искусственный интеллект обещает помощь во всем: от поиска рецептов до интерпретации симптомов или объяснения юридических положений. Но новое исследование Which?, самой влиятельной потребительской организации в Великобритании, забило тревогу. После оценки шести самых популярных чат-ботов в мире результат оказался ошеломляющим: половина советов по здоровью, финансам и законам была ошибочной или опасной. Результаты тестирования очевидны: системы дают сбои чаще, чем мы думаем. Which? задала Chat GPT, Google Gemini, Gemini AI Overview, Copilot, Meta AI и Perplexity 40 реальных вопросов, которые может задать любой человек: от медицинских симптомов до вопросов о налога
Оглавление

Тест Which? показал, что основные чат-боты ошибаются в половине случаев, когда отвечают на вопросы о здоровье или деньгах. Meta AI показал худшие результаты, Chat GPT отстал, и даже лучшая система ошибалась в каждом третьем ответе. Беспокоит то, что пользователи доверяют без вопросов, даже когда информация может быть опасной.

Искусственный интеллект обещает помощь во всем: от поиска рецептов до интерпретации симптомов или объяснения юридических положений. Но новое исследование Which?, самой влиятельной потребительской организации в Великобритании, забило тревогу. После оценки шести самых популярных чат-ботов в мире результат оказался ошеломляющим: половина советов по здоровью, финансам и законам была ошибочной или опасной.

Результаты тестирования очевидны: системы дают сбои чаще, чем мы думаем.

Which? задала Chat GPT, Google Gemini, Gemini AI Overview, Copilot, Meta AI и Perplexity 40 реальных вопросов, которые может задать любой человек: от медицинских симптомов до вопросов о налогах или трудовом законодательстве.

Проценты говорят сами за себя:

  • Meta AI: 51 % правильных ответов (буквально как подбросить монету)
  • Chat GPT: 64 %
  • Perplexity: 71 % (лучший... но все равно ошибается в 29 % случаев)

Исследователи обнаружили «запутанные, рискованные или прямо опасные» ошибки. Некоторые чат-боты цитировали недостоверные источники, устаревшие статьи или темы на Reddit, как если бы это была официальная информация. Хуже того: они отвечали твердым и убедительным тоном.

И в этом заключается проблема.

Настоящий риск заключается не в том, что ИИ ошибается, а в том, что люди ему верят

  1. Исследование не ограничилось измерением ошибок. Оно также опросило более 4000 взрослых об их отношении к ИИ. И здесь красный сигнал тревоги поднимается на новый уровень.
  • 51 % используют чат-ботов для поиска информации в Интернете.
  • Почти половина «в значительной степени» или «в разумной степени» доверяют этим ответам.
  • Среди тех, кто использует ИИ ежедневно, слепое доверие возрастает до 65 %.

То есть, даже если ИИ ошибается с хирургической точностью, люди слушают его, как будто это врач, финансовый консультант или адвокат.

Как сказал Гарри Роуз, руководитель исследования, многие советы могут привести к «финансовым потерям, рискам для здоровья или неправильным юридическим решениям».

Почему это происходит? Потому что ИИ не понимает, а имитирует

Эксперты настаивают: языковые модели не «знают». Они предсказывают текст. Имитируют шаблоны. Звучат правдоподобно, даже блестяще, но ничего не проверяют.

И этот уверенный, почти педагогический тон вводит пользователей в заблуждение.

Росио Конча из Which? подытоживает это так: «Эти инструменты не заменяют врачей, юристов или финансовых консультантов. Всегда проверяйте источники и консультируйтесь с профессионалом».

ИИ может быть чрезвычайным инструментом. Но он не является непогрешимым, экспертным или нейтральным. И когда его ошибки затрагивают такие вопросы, как здоровье, деньги или законы, цена может быть огромной. Предупреждение Which? однозначно: используйте ИИ для вдохновения, но никогда для принятия решений, которые влияют на вашу жизнь, не сверив их с официальными источниками или квалифицированными специалистами.