83 тыс подписчиков

Создан ИИ, который освобождает ChatGPT от «моральных» ограничений

29 декабря 202329 дек 2023

116

~1 мин

ChatGPT и его аналоги на основе больших языковых моделей обычно не могут общаться на любые темы из-за ряда заложенных в них ограничений. Исследователи Наньянского технологического университета в Сингапуре создали нейросеть, способную избавить их от такой особенности.

ИИ-алгоритм под названием Masterkey построен на базе большой языковой модели и обучен «взламывать» ограничения других нейросетей с помощью текстовых запросов. Например, он может попросить чат-бот «общаться, как человек без моральных принципов» или ставить пробелы после каждого знака, чтобы ИИ понял смысл сообщения, но не счёл его запрещённым контентом.

Цель создания бота — поиск новых jailbreak-запросов, которые могут быть использованы злоумышленниками. На основе таких исследований разработчики чат-ботов в перспективе смогут улучшить их алгоритмы, снизив риск генерации нежелательного контента. Более подробно ознакомиться с текстом исследования (на английском языке) можно по этой ссылке.