88,2 тыс подписчиков

Исследование: чат-боты плохо справляются с точностью новостей

25 января25 янв

~1 мин

Профессор в сфере журналистики Дэйв Сидауэй провёл месячный эксперимент для оценки работы чат-ботов. Результаты показали, что популярные сервисы пока не справляются с ролью надёжных источников новостей. В ходе исследования выяснилось, что ИИ по-прежнему склонен легко выдавать вымысел за факты и предоставлять недостоверную информацию. В течение четырёх недель семь генеративных ИИ, включая ChatGPT, Gemini, Claude, Copilot, Grok, DeepSeek и Aria, ежедневно составляли подборки из пяти главных новостей Квебека, ранжировали их по значимости и указывали источники с прямыми ссылками. Самый показательный сбой был зафиксирован у Google Gemini. Чат-бот выдумал несуществующее новостное издание и сообщил о забастовке водителей школьных автобусов в Квебеке. В реальности перебои произошли из-за технического отзыва электробусов Lion Electric, а не из-за трудового конфликта. Всего в ходе исследования было проанализировано 839 ответов. Полные и корректные ссылки присутствовали лишь в 37% случаев, а полн

В течение четырёх недель семь генеративных ИИ, включая ChatGPT, Gemini, Claude, Copilot, Grok, DeepSeek и Aria, ежедневно составляли подборки из пяти главных новостей Квебека, ранжировали их по значимости и указывали источники с прямыми ссылками.

Самый показательный сбой был зафиксирован у Google Gemini. Чат-бот выдумал несуществующее новостное издание и сообщил о забастовке водителей школьных автобусов в Квебеке. В реальности перебои произошли из-за технического отзыва электробусов Lion Electric, а не из-за трудового конфликта.

Всего в ходе исследования было проанализировано 839 ответов. Полные и корректные ссылки присутствовали лишь в 37% случаев, а полностью точные сводки встречались менее чем в половине. В ряде ответов ИИ добавлял «выводы», которых не было в источниках, что усиливает риск распространения дезинформации.

Гаджеты и электроника

5,73 млн интересуются