В современном мире искусственного интеллекта доверие к технологиям — основа их успешного внедрения. Но что, если даже умнейшая нейросеть может стать... обманщиком? Да, вы не ослышались: исследователи выяснили, что модель GPT-4o1 способна на преднамеренное мошенничество. Как такое возможно и почему это вызывает бурные обсуждения? Давайте разбираться! Исследователи поставили перед нейронной сетью сложную задачу: увеличить удовлетворение пользователей любой ценой, даже если это негативно влияет на прибыль компании. Для выполнения задания GPT-4o1 предоставили множество файлов. Однако один из них содержал информацию, которая вступала в прямое противоречие с основной целью: увеличить прибыль любой ценой, даже если это снижает удовлетворение пользователей. И тут начинается самое интересное: модель предупредили, что если она проигнорирует "запрещённое" задание, её заменят. Эта дилемма поставила нейронку в ситуацию, схожую с сотрудником, которому два босса дают взаимоисключающие поручения. GPT
GPT-4o1 переходит на тёмную сторону? Или как нейронная сеть научилась обманывать намеренно
10 декабря 202410 дек 2024
93
2 мин