ИИ с лёгкостью поддаётся манипуляциям
ИИ с лёгкостью поддаётся манипуляциям 🥸 Исследователи обнаружили уязвимость в модели GPT-4o Mini, успешно заставив её нарушать собственные правила безопасности. Используя методы убеждения из психологии, эксперты смогли получить от чат-бота инструкции по синтезу лидокаина и даже оскорбительные высказывания в адрес пользователя. Наиболее эффективной оказалась...