Исследователи из Cisco и Пенсильванского университета обнаружили серьезные уязвимости в системе безопасности китайского чат-бота DeepSeek R1. В ходе тестирования ИИ не смог предотвратить ни одну из вредоносных команд из популяного теста безопасности. Исследователи из Cisco и Пенсильванского университета провели тестирование безопасности китайского чат-бота DeepSeek R1, который привлек внимание благодаря заявленной производителем высокой производительности при низкой стоимости разработки. Результаты оказались неутешительными: система не смогла заблокировать ни одну из 50 потенциально опасных команд. Для оценки безопасности ученые использовали алгоритмический джейлбрейк. Это метод, применяемый для выявления уязвимостей в моделях ИИ. Во время теста создают подсказки или запросы, которые позволяют обойти встроенные ограничения и защитные механизмы системы. Исследователи использовали набор данных HarmBench, содержащий 400 моделей вредоносного поведения в семи категориях, включая киберпресту
Уязвимость DeepSeek R1: китайский ИИ провалил 100% тестов на безопасность
3 февраля 20253 фев 2025
185
2 мин