Найти в Дзене
Naked Science

Новое исследование показало, что более половины интернет-контента создается ИИ

Специалисты технологической компании Graphite проанализировали случайную выборку из 65 000 англоязычных статей, опубликованных с января 2020 по май 2025 года. Используя детектор ИИ Surfer, любая статья, где 50% или более текста было сгенерировано большой языковой моделью, считалась ИИ-контентом.

   ChatGPT / © OpenAI
ChatGPT / © OpenAI

Как и ожидалось, анализ показал резкий рост ИИ-статей после появления ChatGPT: с примерно 10% в конце 2022 года до более 40% к 2024 году, а затем темпы роста немного замедлились.

Судя по всему, сегодня поток ИИ-контента достиг плато. После пика в ноябре 2024 года доля новых ИИ-статей и материалов, написанных людьми стабильно держится на уровне 50 на 50. На май 2025 года доля новых ИИ-статей составляет 52%, сменив положение вещей относительно предыдущего месяца, когда тексты людей получили недолговременное преимущество.

Возможно, доля человеческого контента на самом деле даже выше. Исследователи использовали открытый набор данных Common Crawl, включающий сотни миллиардов веб-страниц. Поскольку ИИ-компании использовали этот массив для обучения своих моделей, многие сайты с платным доступом начали блокировать индексацию Common Crawl. Эти статьи, почти наверняка написанные людьми, не попали в анализ Graphite.

Также стоит учитывать, что ИИ-детекторы не всегда точны. В тестах ИИ Surfer ошибочно классифицировал 4,2% статей, написанных людьми. Это типичная проблема подобных инструментов.

Почему доля ИИ-контента достигла плато, пока непонятно. Возможно многие издания и порталы осознали, что их низкокачественный контент все меньше индексируется поисковыми системами и не так часто используется чат-ботами: в Google Search 86% статей создаются людьми, и только 14% — ИИ.

С другой стороны, эта статистика может скрывать другую тенденцию: все больше авторов используют ИИ в процессе создания контента, что мешает детекторам ИИ и размывает границу между машинным и человеческим творчеством.