Найти тему
4pda.to

Создан ИИ, который освобождает ChatGPT от «моральных» ограничений

   Создан ИИ, который освобождает ChatGPT от «моральных» ограничений
Создан ИИ, который освобождает ChatGPT от «моральных» ограничений

ChatGPT и его аналоги на основе больших языковых моделей обычно не могут общаться на любые темы из-за ряда заложенных в них ограничений. Исследователи Наньянского технологического университета в Сингапуре создали нейросеть, способную избавить их от такой особенности.

-2

ИИ-алгоритм под названием Masterkey построен на базе большой языковой модели и обучен «взламывать» ограничения других нейросетей с помощью текстовых запросов. Например, он может попросить чат-бот «общаться, как человек без моральных принципов» или ставить пробелы после каждого знака, чтобы ИИ понял смысл сообщения, но не счёл его запрещённым контентом.

Цель создания бота — поиск новых jailbreak-запросов, которые могут быть использованы злоумышленниками. На основе таких исследований разработчики чат-ботов в перспективе смогут улучшить их алгоритмы, снизив риск генерации нежелательного контента. Более подробно ознакомиться с текстом исследования (на английском языке) можно по этой ссылке.