Найти в Дзене

Одна модель ИИ может обманом заставить другую нарушить правила.


Многие модели искусственного интеллекта предназначены для выполнения небольших конкретных задач. Они умеют отвечать на вопросы пользователей, генерировать тексты и изображения, а еще отклонять запросы, если программа посчитает их вредными или незаконными. Программисты из компании Leap Laboratories нашли способ обхода таких правил. Они добились того, чтобы модели ИИ могли убеждать друг друга выполнять указания, которые им выполнять не положено.

Одна модель ИИ может обманом заставить другую нарушить правила.   Многие модели искусственного интеллекта предназначены для выполнения небольших конкретных задач.
Около минуты
163 читали