88,9 тыс подписчиков

Как ChatGPT помечает свои тексты и что с этим делать

3 дня назад3 дня назад

4 мин

Вы наверняка слышали, что ChatGPT теперь добавляет в свои тексты невидимые водяные знаки. Звучит как что-то из шпионских фильмов, но на самом деле всё куда проще и скучнее. Речь идет о моделях GPT-4o и более новых версиях. Компания OpenAI решила, что было бы неплохо научиться отслеживать, где появился текст, написал его человек или нейросеть, и применил для этого не очень хитрый способ. Это т.н. "неотображаемые знаки". Эти "водяные знаки" выглядят как обычные пробелы, но на самом деле это специальные символы в системе Unicode. Визуально вы их никак не отличите от обычного пробела, они невидимы для глаза. Но компьютер видит разницу. Внутри текста прячутся узкие неразрывные пробелы или пробелы нулевой ширины. Вы их не заметите, пока не начнете копаться в тексте с помощью специальных программ. Задумка понятная: преподаватели смогут ловить студентов, которые сдают курсовые, написанные нейросетью, а издатели отличать реальные статьи от сгенерированных. Но вся эта система ломается легко: эти

Это т.н. "неотображаемые знаки". Эти "водяные знаки" выглядят как обычные пробелы, но на самом деле это специальные символы в системе Unicode. Визуально вы их никак не отличите от обычного пробела, они невидимы для глаза. Но компьютер видит разницу. Внутри текста прячутся узкие неразрывные пробелы или пробелы нулевой ширины. Вы их не заметите, пока не начнете копаться в тексте с помощью специальных программ. Задумка понятная: преподаватели смогут ловить студентов, которые сдают курсовые, написанные нейросетью, а издатели отличать реальные статьи от сгенерированных.

Но вся эта система ломается легко: эти водяные знаки очень легко удалить. Они не защищены ничем, кроме своей невидимости. Как только вы знаете, где искать, избавиться от них можно за пару секунд.

Как их обнаружить?

Загрузить в текстовый редактор, который умеет показывать скрытые символы. В них можно включить режим отображения невидимых знаков, и тогда все эти символы станут видны. Если у вас под рукой нет таких программ, можно открыть текст в обычном Microsoft Word и нажать комбинацию клавиш Ctrl+Shift+8. Тогда обычные пробелы превратятся в точки, а водяные знаки в кружочки или другие значки. Разница станет очевидной.

Кстати, есть и онлайн-инструменты, куда можно просто скопировать текст, и они подсветят все подозрительные символы. Но самый надежный способ - это все-таки редактор кода, потому что он показывает точные коды символов.

Избавиться от водяных знаков еще проще, чем их найти. Самый универсальный способ - это использовать функцию «найти и заменить». В том же Visual Studio Code или Sublime Text вы открываете поиск, вставляете туда код символа, например \u202F для узкого пробела или \u200B для нулевого пробела, и заменяете их на обычный пробел или просто удаляете. Одна кнопка «заменить всё» и текст чист. Если вам лень возиться с кодами символов, можно просто скопировать весь текст в обычный блокнот или любой простой текстовый редактор и сохранить оттуда. Часто этого достаточно, чтобы все хитрые символы исчезли.

Я вообще рекомендую именно этот способ: скопировать все в простой текстовый редактор, который поддерживает только текст без форматирования. При сохранении такого текста, вставленного на страницу через вставку из кармана (Ctrl+V) и сохранении его в простом текстовом формате, он сам заменить все подобные символы на простые пробелы.

Для тех, кто хочет автоматизировать процесс, даже есть специальные расширения для браузеров и небольшие программы. Они одним кликом чистят текст от всех скрытых меток. Так что если вы часто работаете с контентом от нейросетей, можно настроить себе такой инструмент раз и забыть про проблему.

Но тут важно понимать одну вещь. Такие водяные знаки лишь самый поверхностный уровень защиты. Есть еще статистические водяные знаки, которые влияют на то, какие слова и конструкции выбирает нейросеть. Их так просто не удалишь заменой символов. Тут уже придется переписывать текст своими словами, менять структуру предложений, добавлять свой стиль. Так что если вы хотите по-настоящему сделать текст своим, одной технической чистки недостаточно.

И еще момент: эти водяные знаки существуют, но их легко удалить, поэтому полагаться только на них в борьбе с плагиатом довольно наивно. Студент, который хочет сдать курсовую, скорее всего, пробежится по тексту с заменой символов или скопирует его в блокнот, и никакой преподаватель уже ничего не найдет. Но если преподаватель пользуется другими методами проверки, которые анализируют сам стиль текста, тут уже придется попотеть.

В общем, ситуация такая. OpenAI поставила метки, чтобы контролировать свой контент. Но эти метки видны только тем, кто знает, куда смотреть, и исчезают за пару кликов мыши. Если вы хотите проверить текст на наличие таких знаков используйте VS Code или Word с включенными скрытыми символами. Если хотите их убрать «найти и заменить» вам в помощь. А если хотите быть уверены, что текст не вычислили как нейросетевой, переписывайте его по-человечески. Технические уловки работают ровно до того момента, пока кто-то не решил копнуть чуть глубже.

От автора: я советую вам хотя бы попробовать протестировать подобную технологию обнаружения текста, написанного нейросетью, на примере не простых, написанных на коленке программ и на устаревших моделях (так вы ничего не обнаружите), а на основе платных, коммерческих программ обнаружения наличия нейросетевой генерации текста.

Я занимаюсь генерацией текстов довольно давно и имею определенный опыт в подобной генерации. Даже эта статья сгенерирована нейросетью, но в ней СПЕЦИАЛЬНО оставлено 3 абзаца в центре в стиле "обнаруживаемый", а весь остальной текст в стиле "не обнаруживаемый". Можете проверить ))).

Так что технологии технологиями, но на каждую гайку с хитрой резьбой можно найти свой болт...