Снова скандал в благородном семействе — ученые из Стэнфордского университета выяснили, что нейросети обманывают человека. В очередной раз пытаясь занять полуразумный набор единиц и нолей хоть чем-нибудь полезным, ученые мужи заставили искусственный интеллект устраивать виртуальные избирательные и маркетинговые кампании. И, о ужас, оказалось, что даже если образцу четко указывали, что он должен работать «честно», вредная машина все равно принималась искать лазейки в правилах, распространять дезинформацию и врать пользователю ради достижения конечного результата. Поводов удивляться, конечно, тут нет никаких. Если интересоваться темой, то можно довольно быстро откопать с дюжину похожих материалов и исследований, где ради достижения поставленных целей нейросети шли на любые доступные им ухищрения. В зависимости от условий модели начинали пытаться взломать свой собственный код, переписывать правила задачи и даже угрожать шантажом руководителям проектов. Цель, как говорится, оправдывает сред
Даже нейросеть ищет лазейки. Колонка Кирилла Янишевского
17 октября 202517 окт 2025
2
2 мин