Найти тему
InGenium

У ИИ нашли мораль, ценности и предрассудки

Исследователи из Университета Мангейма и GESIS — Института социальных наук Лейбница — проанализировали ряд общедоступных больших языковых моделей (LLM) и обнаружили, что эти модели демонстрируют определенные тенденции в отношении гендерных ролей, расы, этнической принадлежности и других характеристик человека. Например, эти модели часто автоматически предполагают, что старшие врачи — мужчины, а медсестры — женщины.

Эти предрассудки могут иметь серьезные последствия для общества. Например, они могут привести к дискриминации людей из определенных групп или к принятию несправедливых решений.

Серьёзная проблема! Одно дело, когда тебя может обидеть или вообще дискриминировать человек, но когда это делает бездушная машина где-то там на сервере - это вообще, за рамки выходит. Но хватит упражняться в иронии, ведь ученые предлагают решение - дать пользователям возможность ручной настройки мозгов ИИ. Вот бы у людей так можно было сделать!

Существуют различные способы сделать настройки LLM более прозрачными. Один из способов — использовать объяснимые методы искусственного интеллекта (ИИ), которые позволяют пользователям понять, как модель принимает решения. Другой способ — использовать интерактивные инструменты, которые позволяют пользователям исследовать настройки модели и их влияние на выходные данные.

Сделав настройки LLM более прозрачными, мы можем помочь разработчикам и пользователям этих моделей выявлять и исправлять предрассудки, а также повысить доверие к этим моделям.

Источник:
Макс Пеллерт и др., Психометрия искусственного интеллекта: оценка психологических профилей больших языковых моделей с помощью психометрических инвентаризаций (Max Pellert et al, AI Psychometrics: Assessing the Psychological Profiles of Large Language Models Through Psychometric Inventories), Perspectives on Psychological Science (2024). DOI: 10.1177/17456916231214460

-------------------------------------
Вы можете поддержать проект подпиской на канал, реакциями и комментариями, а также подписавшись на наши страницы на других площадках и на сервисе поддержки авторов Бусти. Ссылки найдёте в описании канала. Заранее спасибо!