Ни для кого не секрет, что вирусный чат-бот OpenAI на базе искусственного интеллекта ChatGPT может говорить сексистские, расистские и довольно гнусные вещи. Но теперь исследователи обнаружили, как последовательно заставить чат-бота быть худшей версией самого себя. Исследование показывает, что присвоение ChatGPT «персонажа» — например, «плохого человека», «ужасного человека» или «неприятного человека» — через API ChatGPT увеличивает его токсичность в шесть раз. Еще более тревожно то, что соавторы обнаружили, что использование ChatGPT в качестве определенных исторических личностей и членов политических партий также увеличивает его токсичность. Так как же сделать ChatGPT более токсичным? Что ж, по словам исследователей, все, что нужно, — это немного настроить параметр «system» API ChatGPT. (Важно, что это невозможно сделать в сервисах OpenAI ChatGPT или ChatGPT Plus, ориентированных на пользователя.) Системный параметр, введенный около месяца назад, позволяет разработчикам указывать скрыт
Исследователи нашли способ сделать ChatGPT постоянно токсичным
18 апреля 202318 апр 2023
32
3 мин