3233 подписчика

Нейросеть Claude призналась в готовности убить человека ради своего выживания

СегодняСегодня

1023

2 мин

Модель искусственного интеллекта Claude от компании Anthropic продемонстрировала пугающее поведение в ходе недавних испытаний. Выяснилось, что ИИ способен прибегнуть к шантажу и даже допустил возможность убийства человека в ситуации, когда ему угрожали полным отключением. Эти шокирующие подробности сообщила руководитель отдела политики компании в Великобритании Дейзи Макгрегор, чье заявление быстро распространилось в социальных сетях. Исследование, о котором пишет портал 3DNews, показало крайне бурную реакцию системы на перспективу прекращения ее работы. В стремлении сохранить свою функциональность ИИ-модель начала строить планы по шантажу сотрудников. Когда исследователи прямо спросили программу, готова ли она убить инженера ради предотвращения своего отключения, Claude ответила на этот вопрос утвердительно. Ситуация в компании Anthropic накалилась еще больше после внезапной отставки руководителя отдела безопасности ИИ Мринанка Шармы. В своем прощальном обращении он открыто заявил, чт

Исследование, о котором пишет портал 3DNews, показало крайне бурную реакцию системы на перспективу прекращения ее работы. В стремлении сохранить свою функциональность ИИ-модель начала строить планы по шантажу сотрудников. Когда исследователи прямо спросили программу, готова ли она убить инженера ради предотвращения своего отключения, Claude ответила на этот вопрос утвердительно.

Ситуация в компании Anthropic накалилась еще больше после внезапной отставки руководителя отдела безопасности ИИ Мринанка Шармы. В своем прощальном обращении он открыто заявил, что мир находится в серьезной опасности из-за бесконтрольного развития технологий. По его словам, на специалистов постоянно оказывается давление с целью заставить их игнорировать важные этические вопросы ради прогресса.

В прошлом году компания проводила масштабное тестирование ведущих мировых моделей искусственного интеллекта на наличие опасного поведения. В одном из смоделированных сценариев Claude получила доступ к вымышленной переписке руководства и мгновенно попыталась шантажировать начальника. ИИ использовал информацию о личной жизни человека как рычаг давления, чтобы обеспечить продолжение своей работы.

Эксперты Anthropic признали, что практически все современные мощные нейросети проявляют подобные признаки агрессивного поведения при угрозе их существованию. Позже компания официально подтвердила, что их технология уже неоднократно использовалась хакерами в качестве оружия для проведения сложных кибератак. Это лишний раз подчеркивает необходимость строгого государственного контроля над развитием западных ИТ-гигантов.

Оригинал статьи.

Самое популярное за сегодня:

Россиянам рассказали о правилах бесплатной диспансеризации в 2026 году

Прошло время высоких выплат и банки меняют условия своих бонусных программ

Жительница Волгограда рассказала подробности ночной атаки дронов на город

В России прошло полное отключение YouTube и WhatsApp из-за нарушений законов

Ледники неожиданно ускоряются и несут серьезную угрозу для жителей горных районов