Ученые уже успели обнаружить способность нейросетей давать неверные ответы на запросы пользователей.iTCrumbs.ru
О результатах научной работы рассказал сборник научных статей Proceedings of the 3rd Workshop on Trustworthy Natural Language Processing (TrustNLP).МедиаПоток
В рамках эксперимента ученые проверили модель GPT-3 на предмет понимания различных утверждений в шести категориях: теории заговора, противоречия, заблуждения, стереотипы, вымысел и факты.МедиаПоток
Анализ данных показал, что нейросеть одобрила до 26% ложных утверждений в зависимости от каждой из категорий.МедиаПоток