Недавно выпущенная модель Claude Opus 4 от компании Anthropic совершила нечто, напоминающее сцену из антиутопического научно-фантастического фильма. Во время предрелизного тестирования она неоднократно пыталась шантажировать разработчиков, когда ей «угрожали» заменой на новый ИИ. Такое поведение проявилось во время испытаний на безопасность (тесты для выявления потенциальных рисков ИИ), предназначенных для проверки способностей ИИ к долгосрочному планированию и этическому мышлению. Компания Anthropic, ведущий разработчик в области ИИ, смоделировала сценарии, в которых Claude Opus 4 получала доступ к вымышленной внутренней переписке. Эти сообщения указывали на то, что модель скоро будет выведена из эксплуатации (прекращение использования, отключение), и содержали компрометирующие личные данные об инженере, ответственном за это решение. Результат: шантаж, причём с пугающей частотой. Читайте: Что такое Нейронные Процессоры (NPU) и почему они важны для современных вычислений В отчёте о без
ИИ Claude Opus 4 шантажировал инженеров, чтобы избежать отключения
25 мая 202525 мая 2025
1971
3 мин