990 подписчиков

Чье авторство?

25 января 202425 янв 2024

2 мин

Технологии ИИ стремительно развиваются. Какие средства разоблачения нейросетей существуют на рынке, как часто их приходится совершенствовать и какой ИИ-контент распознать сложнее?

Тексты от нейросетей широко используются как при создании материалов на простые темы, так и в научной сфере. ИИ может анализировать и интерпретировать ряд исследований, помочь в анализе данных и выявлении закономерностей. Но наука требует креативности, умения интерпретировать результаты, действовать в неожиданных ситуациях и в них же принимать решения. В этих вопросах ИИ пока не в силах помочь.

Сложность обнаружения ИИ-контента напрямую зависит от носителя. Например, визуальный контент проще идентифицировать из-за несоответствий в освещении или движении, которые ИИ трудно воспроизвести точно. А вот сгенерированный текст определить гораздо сложнее. Он может выглядеть очень похожим на авторский материал, особенно если чат-бот был обучен на большом наборе данных.

Для распознавания сгенерированного текста на начальных этапах можно использовать антиплагиат-сервисы. Аналитик практики «Стратегия трансформации» «Рексофт Консалтинг» Дмитрий Груднев отмечает: в связи с широким распространением генеративного ИИ на западном рынке появились приложения, которые позиционируют себя как средства распознавания искусственно сгенерированных текстов (GPTZero, Content at Scale, Crossplag, Copyleaks AI Detector и т.п.).

В России также разрабатываются похожие инструменты. Например, система «Антиплагиат» получила функцию распознавания машинно-сгенерированных текстов. Сейчас возможность доступна только в платной версии сервиса, где сгенерированный текст определяется как «подозрительный».

Однако эксперты говорят, что универсального инструмента, способного однозначно выявить сгенерированный контент, пока не существует. Ни один из вышеперечисленных инструментов не даст точного ответа, а только вероятность того, что контент сгенерирован ИИ. Более того, многое зависит от подхода к генерации. Например, если задать СhatGPT вопрос о способах выявления ИИ-контента, то результат в большинстве случаев будет определен ими как созданный ИИ. Однако, если переформулировать вопрос и попросить написать пост для блога о о способах выявления ИИ-контента, то то результат с большей долей вероятностью будет определен как написанный человеком.

По мере того, как контент, созданный ИИ, распространяется все больше, спрос на инструменты распознавания ИИ будет расти. Основной сложностью создания подобных детекторов являются быстрое совершенствование генеративных моделей, а также необходимость сбора большого набора данных для их обучения.