Найти в Дзене
AndrewBotDeveloper

5 простых способов узнать, был ли текст создан с помощью ИИ

Оглавление

Никого не должно удивлять, что мы видим все больше и больше созданного ИИ письменного контента в Интернете по мере запуска все большего количества генеративных ИИ-платформ и обновления старых моделей. Но может шокировать то, как быстро добавляется контент ИИ.

С ноября 2022 года, когда был запущен ChatGPT 3.5, по март 2024 года, контент ИИ вырос на ошеломляющие 8362%, согласно исследованию, опубликованному компанией по обнаружению ИИ Copyleaks в начале этого года. Конечно, начальная база была очень низкой, но в течение этого периода цифры говорят сами за себя. Результаты показывают, что:

  • Объем онлайн-контента, созданного с помощью ИИ, увеличился на 187% с ноября 2022 года по январь 2023 года.
  • За следующие 12 месяцев количество текстов, написанных с помощью ИИ, в Интернете выросло на 2848%.
  • Согласно исследованию McKinsey, проведенному в марте, использование генеративного ИИ среди респондентов возросло до 65% в 2024 году по сравнению с 33% в 2023 году.

И нет никаких признаков замедления использования генеративного ИИ. Сейчас, как никогда, важно иметь возможность различать контент ИИ и контент, созданный человеком, ради цифровой целостности .

Вот пять способов узнать, был ли написанный контент создан ботом с искусственным интеллектом или нет.

Языковые модели

Вы часто можете видеть в тексте, сгенерированном ИИ, что ему не хватает эмоциональной тонкости и он склонен использовать слишком формальные или сложные слова. Поэтому предложения звучат жестко или скучно без толчка и удара качественного человеческого письма.

Предложения ИИ также не различаются по длине. Возможно, из-за их обучения или программирования их предложения пугающе похожи по количеству слов. Они могут читать очень монотонно и бубнить.

Проблемы с согласованностью

ИИ также, похоже, испытывает некоторые трудности с последовательностью, когда дело касается повествовательных деталей, особенно когда он пытается писать художественную литературу. Вы можете заметить, что у него есть резкие изменения в описании обстановки, где сцена происходит без объяснения или детали внешности персонажа без предупреждения.

Или могут быть несоответствия, которые не соответствуют ранее заявленным фактам по сюжетной линии, демонстрируя ограниченное контекстное понимание ИИ порой. Независимо от этого, это то, на что следует обратить внимание.

Рекомендации по обнаружению инструментов ИИ

Copyleaks упоминался в начале этой статьи, и на своем веб-сайте он утверждает, что является самым точным детектором ИИ на основе нескольких независимых исследований . Одна из особенностей, которая выделяет его среди других решений, заключается в том, что он работает на 30 языках.

Другим широко используемым детектором ИИ для письма является GPTZero . Он очень эффективен при анализе текстовых шаблонов, чрезмерного использования фраз и распространенных словосочетаний, которые GPT обычно циклически используют. Он предлагает бесплатную версию до определенного лимита символов, с большим количеством функций для платных опций.

Ниже приведены два основных скана отправленного в пятницу материала, написанного человеком в 2021 году, до появления инструментов генеративного ИИ. Экран правильно обозначил его как созданный человеком.

Второе изображение — это стихотворение, написанное ChatGPT и загруженное в пятницу, которое также было точно обнаружено. Оба Copyleaks и GPTZero полезны, и лучше всего использовать больше одного.

GPTZero правильно сканирует и идентифицирует фрагмент контента, созданный человеком
GPTZero правильно сканирует и идентифицирует фрагмент контента, созданный человеком
Детектор ИИ GPTZero правильно сканирует и идентифицирует фрагмент контента, созданного ИИ.
Детектор ИИ GPTZero правильно сканирует и идентифицирует фрагмент контента, созданного ИИ.

Глубина и контекст

Другим ключевым признаком в написании ИИ может быть отсутствие деталей, неопределенность или чрезмерные обобщения. По какой-то причине, когда пишут модели ИИ, они склонны избегать глубоких контекстных проблем или прочного тематического понимания.

Текущее поколение этих генеративных предварительно обученных трансформеров обходит сложные темы, требующие личного опыта или экспертных знаний. Они могут уверенно давать объяснения, но без дополнительных деталей, чтобы обоснованно подкрепить свои доводы.

Необычные языковые ошибки

Хотя это случается нечасто, тексты, сгенерированные ИИ, иногда содержат странные ошибки или обороты речи, которые неловко неуместны. Например, однажды я прочитал статью-образец ИИ об изменении климата, в которой деревья упоминались как «знаменитости Дня древонасаждения».

Подобные необычные сочетания общеупотребительных фраз, неправильных словосочетаний или элементарных грамматических ошибок — например, недавняя перепалка вокруг ChatGPT, утверждающего, что в слове strawberry всего две буквы «r» , — являются полезными подсказками о том, что текст был создан искусственным интеллектом.

Очевидно, что мы находимся на ранних страницах хронологической книги о генеративном ИИ. Поскольку искусственный интеллект никуда не денется — кроме как на новые уровни ускоренного принятия — наша обязанность — идти в ногу с последними разработками как в области генерации, так и обнаружения ИИ, чтобы ИИ не пришлось писать свою историю самостоятельно.