Добавить в корзинуПозвонить
Найти в Дзене
4pda.to

Исследование: чат-боты плохо справляются с точностью новостей

Профессор в сфере журналистики Дэйв Сидауэй провёл месячный эксперимент для оценки работы чат-ботов. Результаты показали, что популярные сервисы пока не справляются с ролью надёжных источников новостей. В ходе исследования выяснилось, что ИИ по-прежнему склонен легко выдавать вымысел за факты и предоставлять недостоверную информацию. В течение четырёх недель семь генеративных ИИ, включая ChatGPT, Gemini, Claude, Copilot, Grok, DeepSeek и Aria, ежедневно составляли подборки из пяти главных новостей Квебека, ранжировали их по значимости и указывали источники с прямыми ссылками. Самый показательный сбой был зафиксирован у Google Gemini. Чат-бот выдумал несуществующее новостное издание и сообщил о забастовке водителей школьных автобусов в Квебеке. В реальности перебои произошли из-за технического отзыва электробусов Lion Electric, а не из-за трудового конфликта. Всего в ходе исследования было проанализировано 839 ответов. Полные и корректные ссылки присутствовали лишь в 37% случаев, а полн
   Исследование: чат-боты плохо справляются с точностью новостей
Исследование: чат-боты плохо справляются с точностью новостей

Профессор в сфере журналистики Дэйв Сидауэй провёл месячный эксперимент для оценки работы чат-ботов. Результаты показали, что популярные сервисы пока не справляются с ролью надёжных источников новостей. В ходе исследования выяснилось, что ИИ по-прежнему склонен легко выдавать вымысел за факты и предоставлять недостоверную информацию.

-2

В течение четырёх недель семь генеративных ИИ, включая ChatGPT, Gemini, Claude, Copilot, Grok, DeepSeek и Aria, ежедневно составляли подборки из пяти главных новостей Квебека, ранжировали их по значимости и указывали источники с прямыми ссылками.

Самый показательный сбой был зафиксирован у Google Gemini. Чат-бот выдумал несуществующее новостное издание и сообщил о забастовке водителей школьных автобусов в Квебеке. В реальности перебои произошли из-за технического отзыва электробусов Lion Electric, а не из-за трудового конфликта.

-3

Всего в ходе исследования было проанализировано 839 ответов. Полные и корректные ссылки присутствовали лишь в 37% случаев, а полностью точные сводки встречались менее чем в половине. В ряде ответов ИИ добавлял «выводы», которых не было в источниках, что усиливает риск распространения дезинформации.