11 подписчиков

Искусственный интеллект превосходит экспертов-этиков в предоставлении нравственных советов

27 июня 202427 июн 2024

1 мин

Ключевые выводы: Растущее использование языковых моделей в сложных процессах принятия решений повышает актуальность вопроса, могут ли они считаться нравственными экспертами. Последние исследования показывают, что крупные языковые модели (LLM) способны отражать нравственные суждения с высокой точностью. Но для подлинной нравственной экспертизы требуется не просто согласованность суждений, но и четкое и заслуживающее доверия нравственное рассуждение. В новом исследовании мы сравнили качество нравственных советов, предоставляемых GPT-4o, с советами известного эксперта-этика из колонки The Ethicist в The New York Times. Участники оценивали советы по таким критериям, как моральность, заслуживаемое доверие, вдумчивость и правильность. Результаты показали, что советы GPT-4o были оценены выше по всем этим параметрам по сравнению с советами эксперта-этика. Более того, хотя участники чаще распознавали советы GPT как сгенерированные искусственным интеллектом, модель все же превзошла человеческо

Ключевые выводы:

Новейшая модель языковых моделей GPT-4o обошла популярную колонку советов The Ethicist в The New York Times по качеству предоставляемых нравственных рекомендаций.
Советы GPT-4o были оценены как более моральные, заслуживающие доверия, вдумчивые и правильные по сравнению с советами эксперта-этика.
Хотя участники исследования чаще распознавали советы, написанные GPT, как сгенерированные искусственным интеллектом, модель все же превзошла человеческого эксперта в нравственном консультировании.
Результаты свидетельствуют, что современные языковые модели достигли определенного уровня нравственной экспертизы, способные предоставлять ценные моральные советы и дополнять человеческие знания в этой области.

Растущее использование языковых моделей в сложных процессах принятия решений повышает актуальность вопроса, могут ли они считаться нравственными экспертами. Последние исследования показывают, что крупные языковые модели (LLM) способны отражать нравственные суждения с высокой точностью. Но для подлинной нравственной экспертизы требуется не просто согласованность суждений, но и четкое и заслуживающее доверия нравственное рассуждение.

В новом исследовании мы сравнили качество нравственных советов, предоставляемых GPT-4o, с советами известного эксперта-этика из колонки The Ethicist в The New York Times. Участники оценивали советы по таким критериям, как моральность, заслуживаемое доверие, вдумчивость и правильность.

Результаты показали, что советы GPT-4o были оценены выше по всем этим параметрам по сравнению с советами эксперта-этика. Более того, хотя участники чаще распознавали советы GPT как сгенерированные искусственным интеллектом, модель все же превзошла человеческого эксперта в нравственном консультировании.

Эти результаты свидетельствуют, что современные языковые модели достигли определенного уровня нравственной экспертизы и могут дополнять человеческие знания в этой области. Важно тщательно программировать этические руководящие принципы в LLM, учитывая их потенциальное влияние на нравственные рассуждения пользователей. В то же время данные находки открывают перспективы для использования LLM в качестве ценных помощников в нравственном консультировании и принятии решений.

Авторы исследования :

Дэника Диллион, Дебанджан Мондал, Никет Тандон, Курт Грей