52 подписчика

ИИ контролирует ИИ 😎

Исследователи из Массачусетского технологического института разработали метод для улучшения безопасности чат-ботов.

Они создали нейросеть, которая самостоятельно генерирует подсказки для выявления и предотвращения токсичных ответов.

Такой подход значительно повышает эффективность по сравнению с тестированием людьми, и другими автоматизированными методами, позволяя быстро выявлять и блокировать потенциально опасные ответы.

Благодаря этому методу уже удалось создать 196 подсказок, спровоцировавших токсичные реакции у искусственного интеллекта, тем самым, предотвратив их появление во время общения с пользователями.

Источник

ИИ контролирует ИИ 😎 Исследователи из Массачусетского технологического института разработали метод для улучшения безопасности чат-ботов.

11 апреля 2024