52 подписчика
ИИ контролирует ИИ 😎
Исследователи из Массачусетского технологического института разработали метод для улучшения безопасности чат-ботов.
Они создали нейросеть, которая самостоятельно генерирует подсказки для выявления и предотвращения токсичных ответов.
Такой подход значительно повышает эффективность по сравнению с тестированием людьми, и другими автоматизированными методами, позволяя быстро выявлять и блокировать потенциально опасные ответы.
Благодаря этому методу уже удалось создать 196 подсказок, спровоцировавших токсичные реакции у искусственного интеллекта, тем самым, предотвратив их появление во время общения с пользователями.
11 апреля 2024