Найти тему
52 подписчика

ИИ контролирует ИИ 😎


Исследователи из Массачусетского технологического института разработали метод для улучшения безопасности чат-ботов.

Они создали нейросеть, которая самостоятельно генерирует подсказки для выявления и предотвращения токсичных ответов.

Такой подход значительно повышает эффективность по сравнению с тестированием людьми, и другими автоматизированными методами, позволяя быстро выявлять и блокировать потенциально опасные ответы.

Благодаря этому методу уже удалось создать 196 подсказок, спровоцировавших токсичные реакции у искусственного интеллекта, тем самым, предотвратив их появление во время общения с пользователями.

ИИ контролирует ИИ 😎  Исследователи из Массачусетского технологического института разработали метод для улучшения безопасности чат-ботов.