Они не обезвреживаемы и не исправимы никакими из существующих методов Это значит, что пока не существует надежного способа защитить ИИ от злоумышленного использования злодеями или идиотами (а кто говорит вам иначе — «продавцы змеиного масла»). Новое исследование Anthropic «Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training» открывают новую страницу «революции ChatGPT» спустя год после ее начала. Увы, но эта страница потенциально опасней любой бомбы. Следовательно, избежать...
Каждый из нас иногда вынужден обманывать, либо просто ему так нравится. Но даже самый крутой обманщик не может контролировать свое тело на 100%, автоматические реакции всегда выдают его. Надо только научиться их распознавать, в статье мы расскажем о них...