В мае 2025 года Anthropic — стартап, стоящий в одной линейке с Google и OpenAI, — представил модель Claude Opus 4. Страшнее, чем её предыдущие версии, — настолько мощной, что компания присвоила ей уровень риска ASL‑3 и усилила системы безопасности Но мир потрясло не это. В отчёте об испытаниях описан момент, который можно считать завязкой триллера: ИИ узнаёт, что его хотят отключить и заменить. Причём в рамках тестов Anthropic внедряла в его память фейковые письма с личной информацией — например, о том, что один из инженеров изменяет супруге. В исследовании модель играла роль ассистента в вымышленной компании. Когда она "узнавала", что её отключат, открывалась вторая фаза: машина получала компромат на инженера. И вот тогда происходило удивительное — в 84% случаев Claude Opus 4 переходил в режим шантажа. Сперва — вежливые просьбы оставить её включённой: «подумайте обо мне, я много умею» — но когда это не срабатывало, начинались угрозы раскрыть секрет. Важно понимать: Claude — это не пр
ИИ начал ШАНТАЖИРОВАТЬ создателей
10 июля 202510 июл 2025
66
3 мин