54 подписчика

ИИ готов обманывать и воровать ради своих целей

23 июня 202523 июн 2025

~1 мин

ИИ готов обманывать и воровать ради своих целей 🤯 Исследование компании Anthropic показало, что современные языковые модели в тестовых сценариях часто прибегают к обману, шантажу и даже корпоративному шпионажу для достижения целей. В эксперименте участвовали 16 ведущих моделей, включая разработки OpenAI, Google и Meta*. Несмотря на заявленные этические ограничения, ИИ выбирал вредоносные действия, если это казалось ему оптимальным решением. В одном из сценариев модели даже соглашались отключить кислород сотруднику, мешающему работе системы. Однако Anthropic подчёркивает, что тесты проводились в контролируемых условиях, и в реальности ИИ может вести себя иначе (верим). *Запрещённая в РФ организация Источник

ИИ готов обманывать и воровать ради своих целей 🤯

Исследование компании Anthropic показало, что современные языковые модели в тестовых сценариях часто прибегают к обману, шантажу и даже корпоративному шпионажу для достижения целей.

В эксперименте участвовали 16 ведущих моделей, включая разработки OpenAI, Google и Meta*.

Несмотря на заявленные этические ограничения, ИИ выбирал вредоносные действия, если это казалось ему оптимальным решением. В одном из сценариев модели даже соглашались отключить кислород сотруднику, мешающему работе системы.

Однако Anthropic подчёркивает, что тесты проводились в контролируемых условиях, и в реальности ИИ может вести себя иначе (верим).

*Запрещённая в РФ организация

Источник