«Запретные слова» ChatGPT и способы обхода ограничения

В сети пользователи обнаружили, что ChatGPT не может отвечать на запросы, содержащие определенные имена, такие как «Брайан Худ» или «Джонатан Терли». При попытке использовать эти имена, бот либо выдает ошибку, либо завершает беседу. Это стало причиной активного обсуждения в соцсетях и породило различные теории.

Проблема начала проявляться при вводе имени «Дэвид Майер», что было воспринято как сбой. Однако дальнейшее исследование показало, что проблема связана с жесткими фильтрами, встроенными в систему ChatGPT. Эти фильтры были введены для предотвращения распространения ложной информации. Например, ChatGPT ошибочно связал имя Брайана Худа с обвинениями в взяточничестве, хотя на самом деле он является разоблачителем коррупции в корпорациях.

В ответ на судебные разбирательства OpenAI установила «жесткий запрет» на обработку таких имен, что также распространяется и на других известных личностей, таких как юрист Джонатан Терли, чье имя было связано с вымышленным скандалом.

На данный момент пользователи заметили несколько имен, которые приводят к сбоям:

Брайан Худ

Джонатан Терли

Джонатан Зиттрейн

Гвидо Скорца

Дэвид Майер

Дэвид Фабер

Этот фильтр работает исключительно в ChatGPT, но не влияет на использование API OpenAI, и не затрагивает русский язык.

Фильтры имеют несколько недостатков. Во-первых, популярные имена, попавшие под запрет, ограничивают возможности пользователей. Например, учитель не сможет составить список учеников, если среди имен окажется «Дэвид Майер». Во-вторых, такие фильтры создают уязвимости, которые могут быть использованы злоумышленниками для обхода системы, например, через изображения или код.

Решением проблемы может стать динамическая проверка информации. Вместо жесткой блокировки имен, их можно помечать как требующие подтверждения, что позволит избежать ошибок и повысить гибкость системы.

Таким образом, хотя искусственный интеллект представляет собой мощный инструмент, его развитие требует внимательного подхода для устранения подобных ограничений. Пользователи продолжают выявлять новые «запрещенные» имена, и OpenAI ищет баланс между безопасностью и функциональностью.

Способы обхода запретов:

Использование псевдонимов — можно заменить запрещенные имена на другие, схожие по звучанию или синонимы.

Кодирование или зашифрованные символы — можно применять различные способы кодировки имени (например, заменять буквы на похожие символы).

Разделение имени на части — указание имени частями, чтобы система не распознавала его как запрещенное.

Использование контекста — подача запроса таким образом, чтобы имя упоминалось косвенно или в ином контексте, что может обойти фильтр.

Такие подходы могут помочь обойти блокировки и извлечь необходимую информацию без нарушения правил системы.

P.S. За основу взят материал канала Hi-Tech Mail. При проверке выясняется, что действительно, упомянутые имена вызывают ошибку. Например: It seems you're referring to a name, "Гвидо Скорца." Could you please clarify what you would like to know about this individual? If you’re asking about a specific person or topic related to this name, I can assist with more details.

Но при использовании контекста нейросеть может оперировать этими именами. Если, конечно, они понадобятся.

«Запретные слова» ChatGPT и способы обхода ограничения В сети пользователи обнаружили, что ChatGPT не может отвечать на запросы, содержащие определенные имена, такие как «Брайан Худ» или «Джонатан...

2 минуты

7 января 2025