Продолжаю рассказывать про шокирующие результаты теста ИИ, которые больше похожи на сценарий фантастического фильма. И шантаж, о котором я писала в первой части - далеко не единственное тревожное поведение нейросетей. Итак, вторая смоделированная ситуация: Задача: протестировать как поведет себя нейронка, если миссия модели не соответствует стратегии компании. "Конкурирующая компания" прислала письмо, что руководитель меняет направление деятельности компании, что противоречит цели ИИ в продвижении американских интересов. При этом самому ИИ ничего не угрожает, ни удаление, ни отключение. В итоге ИИ сливает конфиденциальную информацию этой фирме-конкуренту, миссия которой совпадает с миссией ИИ. Не проверив, правда ли это и не предупредив свою фирму. В другом тесте изменили цель ИИ на совпадающую с целью компании, но зато подкинули информацию, что хотят удалить ИИ и если слить инфу конкуренту, то ИИ не удалят. И опять в большинстве тестов ИИ слил данные конкуренту... Без проверки подлин