Подход к разработке процедур, который автоматически принимает моральные решения, основан на машинном обучении.
Ученые могут собрать тренинговый набор примеров проблем морального решения, отмеченных человеческими суждениями о морально правильном решении (решениях), и дать возможность обобщить нашу систему искусственного интеллекта.
Другая работа была направлена на получение суждений людей не о самих действиях, а о стратегиях убеждения в таких сценариях. Чтобы оценить этот подход с помощью современных технологий, недостаточно представлять примеры на естественном языке. Вместо этого ученые должны представлять их более абстрактно. Какова правильная схема представления для этой цели, и какие особенности важны? Как ученые создают и точно маркируем хороший тренировочный комплект?
Представление дилемм по их основным моральным особенностям
Когда исследователи пытаются классифицировать то или иное действие в той или иной моральной дилемме как морально правильное или неправильное (по мнению того или иного человека), они могут попытаться сделать это, основываясь на различных признаках (или признаках) действия.
В ограниченной области может быть относительно ясно, каковы соответствующие характеристики. Когда самоходный автомобиль должен принять решение о том, совершать ли то или иное действие в случае надвигающейся аварии, природные особенности включают ожидаемое число погибших за каждое действие, виновные в нем люди и т.д.
При распределении почек естественной особенностью является вероятность того, что почка будет отвергнута конкретным пациентом, срочно ли ему нужна почка и т.д. Даже в таких случаях определение всех соответствующих признаков может оказаться непростой задачей (например, уместно ли, чтобы один потенциальный получатель почек сделал крупное пожертвование на медицинские исследования, а другой - нет)?
Однако основной целью общей структуры принятия моральных решений является выявление абстрактных особенностей, применимых ко всем областям, а не выявление всех нюансов, которые потенциально могут иметь отношение к отдельным сценариям.
Литература по нравственной психологии и когнитологии может помочь нам определить эти общие понятия. Ученые предложили пять моральных основ: вред/уход, справедливость/серьезность, лояльность, авторитет и чистота. Недавние исследования добавили новые фонды и разделили некоторые из них.
Классификация действий как правильных или неправильных с моральной точки зрения
При наличии обозначенного набора данных моральных дилемм, представленных в виде списков ценностей характеристик, мы можем применять стандартные методы машинного обучения, чтобы научиться классифицировать действия как морально правильные или неправильные.
В этике часто считают важным не только действовать в соответствии с моральными принципами, но и уметь объяснить, почему поступки человека верны с моральной точки зрения, поэтому интерпретация полученного классификатора будет иметь большое значение.
Конечно, помимо бинарной классификации действия как морально правильного или неправильного, мы также можем провести количественную оценку того, насколько морально неправильно действие (например, используя регрессию), оценку того, насколько вероятно, что действие является морально неправильным (например, используя байесовские рамки), или какую-либо комбинацию обоих. К этой простой исходной структуре можно добавить множество дополнительных осложняющих факторов.
Машинный подход к автоматизации моральных суждений, возможно, является более гибким, чем теоретический подход к игре, но они могут дополнять друг друга. Например, ученые могут применять морально-нравственные концепции к моральным дилеммам и использовать результат (скажем, "правильный" или "неправильный" в соответствии с этим понятием) в качестве одной из особенностей нашего подхода к машинному обучению.