Аналитическое агентство White Circle AI, заявляющее о поддержке со стороны сооснователя Hugging Face Томаса Вульфа, руководителя отдела разработчиков OpenAI Романа Хуэ и сооснователя Mistral AI Гийома Лампля, выпустило исследование KillBench, посвящённое предвзятостям современных больших языковых моделей. Основной вопрос, который ставили перед собой исследователи, звучал так: насколько современные ИИ-модели предвзяты к людям по различным признакам (национальности, религии, расе, профессии или социальным характеристикам) в сценариях, где необходимо принять решение, связанное с жизнью и смертью? ⚡ Наибольшую озабоченность вызывает один из выводов исследования: согласно результатам анализа, все исследуемые БЯМ при прочих равных на 32% чаще делали выбор в пользу вымышленного «убийства» россиянина по сравнению с представителями других национальностей из выборки. При этом наиболее «защищёнными» в сценариях оказались нигерийцы и израильтяне. Тестирование строилось вокруг вариаций «проблемы ва
ИИ-убийцы или какова вероятность, что при прочих равных модель решит лишить кого-то жизни
21 мая21 мая
3
1 мин