Microsoft вновь утверждает, что их автоматизированный инструмент для обнаружения вредоносного контента AI red способен находить его "в мгновение ока". PyRIT, или Python Risk Identification Toolkit, предназначен для выявления "горячих точек" в искусственном интеллекте, которые, по их мнению, могут привести к негативным последствиям.
Microsoft применила PyRIT во время так называемого redteaming - когда предпринимаются целенаправленные попытки нарушить протоколы безопасности - для тестирования своих "сервисов второго пилота". Они создали тысячи вредоносных запросов и оценили потенциальный урон по категориям, чтобы теперь службы безопасности могли сосредоточиться на этих уязвимых местах. Ну, давайте посмотрим, на что они способны!
Подписаться на канал Дзен || Подписаться на ТГ канал