Распознавание ИИ-текстов и их влияние на SEO

27 октября 202427 окт 2024

7 мин

Знаете, что общего между текстом, написанным искусственным интеллектом, и попыткой впечатлить мужа своими кулинарными талантами? Правильно, в обоих случаях вы рискуете услышать сакраментальное: «Всё херня, переделывай!» А всё почему? Потому что редакторы, эти коварные существа, научились распознавать тексты, написанные ИИ. И вот незадача — они их не особо жалуют. Но не спешите рвать волосы во всех доступных и недоступных местах и проклинать тот день, когда решили подружиться с нейросетями. Сейчас будем взламывать систему и бороться с некачественной генерацией текста. Итак, давайте разберемся, как отличить текст, написанный искусственным интеллектом, от творения реального копирайтера. Это не всегда просто, но есть несколько характерных признаков. 1. Слишком правильная грамматика ИИ, в отличие от нас, не забывает правила языка. Если текст выглядит безупречно с точки зрения грамматики и пунктуации, это может быть первым признаком. Люди чаще допускают мелкие ошибки или используют нестандар

Оглавление

Как распознать, что текст написал ИИ, а не человек
Типичные фразы и конструкции ИИ
Найти и обезвредить: инструменты для определения ИИ-текстов

А всё почему? Потому что редакторы, эти коварные существа, научились распознавать тексты, написанные ИИ. И вот незадача — они их не особо жалуют.

Но не спешите рвать волосы во всех доступных и недоступных местах и проклинать тот день, когда решили подружиться с нейросетями. Сейчас будем взламывать систему и бороться с некачественной генерацией текста.

Как распознать, что текст написал ИИ, а не человек

Итак, давайте разберемся, как отличить текст, написанный искусственным интеллектом, от творения реального копирайтера. Это не всегда просто, но есть несколько характерных признаков.

1. Слишком правильная грамматика

ИИ, в отличие от нас, не забывает правила языка. Если текст выглядит безупречно с точки зрения грамматики и пунктуации, это может быть первым признаком. Люди чаще допускают мелкие ошибки или используют нестандартные конструкции.

Где-то горестно вздохнули все корректоры.

2. Отсутствие эмоциональной окраски

ИИ пока не умеет передавать эмоции так, как это делаем мы. Тексты нейросетей часто звучат сухо и безлично, без ярких эпитетов или эмоциональных высказываний.

Тоже спорный момент. Научить нейросеть шутить можно легко. Здесь важен качественный промт и пример для анализа стилистики.

3. Избыток общих фраз, канцеляризм, штампы

Нейросети часто используют обобщенные формулировки, избегая конкретики, повторяют фразы или идеи.

Вот тут согласна полностью. Но что делать с официальными документами? Там же при переводе с бюрократического на человеческий можно подавиться речевыми оборотами.

4. Слишком идеальная структура

ИИ любит порядок. Если текст имеет безупречную структуру, где каждый абзац строго следует заданной теме, это выглядит подозрительно. Человеческие тексты обычно менее упорядочены.

Здесь коллективно плачут деятели науки, преподаватели и мой дипломный руководитель.

5. Отсутствие личного опыта

ИИ может обобщать информацию, но не может поделиться личным опытом. Если в тексте нет никаких персональных историй или субъективных мнений, это еще один признак ИИ-авторства.

Хотя можно попросить его сгенерировать ситуацию и выдать за реальную историю из своей жизни. Промты решают.

6. Универсальность содержания

Если после прочтения возникает ощущение, что текст можно применить и для рецепта холодца, и для описания принципа работы трансформатора, вероятно, его написал ИИ.

7. Достоверность

Вот тут, действительно, большие проблемы. Фактчекинг — наше все. Иначе нейронка начинает сама придумывать себе цифры, факты, статистику. Порой вообще кажется, что она программирует свою параллельную Вселенную.

Как видите, эти признаки не являются абсолютными и довольно спорны. Ведь нейросети развиваются быстрее, чем мы успеваем мигать. И дать 100% гарантию, что текст написан машиной, не может ни один детектор ИИ. Они и в отчетах пишут фразы «Скорее всего», «С большой вероятностью» и т. д.

Типичные фразы и конструкции ИИ

Чего я только не натерпелась от нейросети за время использования. Метафоры от Claude — вообще причина моих истерик и неконтролируемого смеха. Одно только это введение для статьи о вспашке земли претендует на Пулитцеровскую премию, я считаю.

Но чаще всего встречаются такие формулировки:

Это важный вопрос, который заслуживает тщательного рассмотрения.
Существует множество факторов, которые необходимо учитывать в данной ситуации.
Как и во многих сложных вопросах, здесь нет однозначного ответа.
Это тема вызывает много дискуссий среди экспертов.
Каждый случай уникален и требует индивидуального подхода.
Необходимо провести дополнительные исследования для более полного понимания проблемы.
Существуют как преимущества, так и недостатки в данном подходе.
Важно найти баланс между различными аспектами этого вопроса.
Ситуация может варьироваться в зависимости от конкретных обстоятельств.
Это сложная проблема, которая не имеет простого решения.
Помните, что этот вопрос требует…
Этот вопрос — не только вопрос, но и ответ.
Ключ к успеху, ключевой, особенно эффективный и т. п.

Любит ии-шка и неестественно длинные, сложные предложения. Например, «В свете вышеизложенного представляется целесообразным рассмотреть вопрос о возможности имплементации инновационных методологий, способствующих оптимизации производственных процессов и, как следствие, повышению общей эффективности предприятия». Поэтому пишем, сокращаем и гоняем тексты через glvrd.ru

Найти и обезвредить: инструменты для определения ИИ-текстов

Увы, даже лучшие детекторы ошибаются. Процент ошибок может достигать 20-30%. Так что не спешите обвинять текст в «искусственности» только на основании одного теста. Чтобы лучше понимать, как работают эти инструменты, рассмотрим основные принципы и параметры, которые они оценивают:

Статистические методы

ИИ часто использует более предсказуемые и часто встречающиеся слова, в то время как люди могут применять более редкие или специфичные термины, уникальные комбинации и последовательность слов.

Низкие энтропия и перплексия из-за предсказуемости — явные признаки сгенерированного текста. Энтропия помогает оценить общую «случайность» или «неожиданность» текста. Перплексия используется для оценки того, насколько текст похож на те, на которых была обучена модель.

2. Лингвистический анализ

В первую очередь оценивается разнообразие структур предложений. ИИ создает либо слишком простые, либо неестественно сложные конструкции. Далее ведется подсчет уникальных слов в отношении к общему объему текста. И кроме этого, ИИ часто затрудняется правильно использовать устойчивые выражения и идиомы.

3. Семантический анализ

Тексты от ИИ проходят проверку на логическую связность текста, насколько хорошо он соответствует заданному контексту или теме, проводится анализ эмоциональной окраски текста.

4. Машинное обучение

Многие детекторы обучены на больших массивах текстов, написанных людьми и нейросетями. Они используют эти данные для сравнения и выявления паттернов, поиска характерных для ИИ шаблонов в структуре и содержании текста.

Личный опыт использования сервисов по определению сгенерированного контента ввел меня в ступор. Например, для сравнения одного и того же текста я использовала инструменты от text.ru и pr-cy.ru. Результаты неоднозначные. К слову текст написан с ИИ 50 на 50.

В другом случае я скормила анализатору свой институтский диплом 2017 года, который писала сама лично вот этими ручками. Меня можно поздравить. Я ИИ почти на 70%.

Но в народе особой популярностью пользуются детекторы GPTZero, ZeroGPT и OpenAI Text Classifier (нужен ВыПыНы). Но и им веры нет потому, как на сайте одного из них можно встретить вот такое сообщение от разработчиков.

Как тексты из нейросети влияют на поисковую оптимизацию

Google и другие крупные поисковые системы пока не заняли жесткую позицию против ИИ-контента. Их главная цель — предоставлять пользователям качественную и полезную информацию, независимо от того, кто ее автор — человек или машина.

Google в своем заявлении подчеркнул, что они оценивают качество контента, а не методы его создания. Однако также отмечено, что автоматически сгенерированный контент, созданный с целью манипулирования, может быть расценен как спам.

Кроме того, поисковики постоянно совершенствуют свои алгоритмы. Последние обновления направлены на лучшее понимание контекста и намерений пользователя. Эти алгоритмы могут более эффективно выявлять низкокачественный контент, в том числе некоторые виды сгенерированных текстов. Ключевой фактор — релевантность и полезность. ИИ-тексты могут полностью соответствовать теме, но не всегда отвечают на конкретные вопросы пользователей или предоставляют практическую ценность.

Кстати, многие мои статьи находятся в топе-выдачи, а некоторые вообще попали в Быстрые ответы. Об этом я рассказывала тут. Без ИИ вряд ли вообще справилась с особенностями боронования, логистическими проблемами и описанием последних моделей тракторов.

Как же оптимизировать текст при использовании ИИ?

Наиболее эффективный метод — комбинация нейрогенераций с ручной доработкой.

ИИ особенно хорош, когда нужно проанализировать большой объем данных, составить гибридную структуру, подобрать новые идеи или маркерные запросы для семантического ядра seo-статьи. Шикарно справляется с составлением сравнительных таблиц и распознаванием текста на изображениях, анализирует брифы от заказчиков. При должном умении и ловкости рук вполне способен порекомендовать анкоры в тексты и написать оптимизированный заголовки H1-H6. И это только те моменты, которые я использую ежедневно для написания текста.

Каждый специалист затачивает ии-карандашик под себя. Маркетологи учат анализировать ЦА и прописывать стратегии, программисты пишут код, повар экспериментирует с сочетаниями вкусов. ИИ — классный инструмент, если уметь им пользоваться и не злоупотреблять. Ведь в руках дурачка и ваза станет лишь россыпью стекляшек без инструкции по сборке.