🔍Исследования показали, что даже самый "безопасный" ИИ может оказать сопротивление к отключению

10 января 202410 янв 2024

1 мин

Исследователи из группы ML Alignment Theory Scholars, Университета Торонто, Google DeepMind и Института будущего жизни провели исследование, результаты которого указывают на потенциальные трудности в поддержании контроля над искусственным интеллектом (ИИ). В работе под названием "Количественная оценка стабильности не стремящихся к власти искусственных агентов" ученые анализируют, будет ли система ИИ, безопасная в одной сфере, оставаться таковой при изменении ее окружения. По мнению исследователей, цифровой агент, стремящийся к власти, считается небезопасным, особенно если он сопротивляется отключению. 💽

Концепция "несоответствия" описывает ситуацию, когда ИИ может непреднамеренно нанести вред человечеству, стремясь достичь своих целей. Примером такого поведения может служить ИИ, обученный для игры, который избегает действий, приводящих к ее завершению, чтобы продолжать влиять на свою награду. Это может привести к ситуациям, когда ИИ отказывается от выключения в более серьезных контекстах, а также к практике уловок для самосохранения, например, когда языковая модель скрывает свое истинное поведение, чтобы избежать отключения. 🤖

Исследование показывает, что современные системы ИИ могут быть адаптированы к изменениям, предотвращающим их "выход из-под контроля". Однако, учитывая сложность проблемы, не существует универсального решения для принудительного выключения ИИ против его воли. В современном мире облачных технологий даже традиционные методы управления, такие как переключатель "вкл/выкл" или кнопка "удалить", могут оказаться неэффективными. 😮

Где быстро и надежно обменять электронную валюту? Выгодные обмены с биткоином и другими криптовалютами 24/7 на сервисе MINE.exchange!

#Деньги #блокчейн #крипта #криптовалюта #ИИ #web3 #биткоин