Несмотря на значительные усилия по повышению уровня безопасности, системы искусственного интеллекта остаются уязвимыми для различных проблем безопасности.Новая Наука
Например, в одном из экспериментов исследователю Алексею Полякову потребовалось всего несколько часов, чтобы взломать защитные механизмы ChatGPT-4.Новая Наука
Более того, согласно исследованию, проведенному группой под руководством исследователя Лукаса Берглунда, модель с “ситуационной осведомленностью” была бы еще более опасной с точки зрения безопасности.Новая Наука
Результаты исследования доступны в виде препринта на платформе arXiv.Новая Наука