Гонка вооружений между желающими создать искусственный текст, и теми, кому надо это разоблачить, продолжается. Разработчики из Стенфорда под руководством Эрика Энтони Митчелла выпустили на прошлой неделе сервис DetectGPT. В первоначальных экспериментах инструмент точно определяет авторство человека или нейросети в 95% случаев. Научная статья с описанием вышла пока в препринте, о разработке сообщили в университете.
Пока инструмент находится на ранней стадии, но Митчелл надеется улучшить его до такой степени, что он сможет принести пользу обществу. Принцип работы сервиса также построен на ранжировании, как и у самой нейросети. В оригинале, если говорить упрощенно, алгоритм, которого просят нарисовать картинку или создать текст, распознает запрос, затем распознает, насколько закономерности или образы, которые он получил в результате обучения, соответствуют запросу. Новый сервис определяет, насколько нейросети «нравится» тот или иной текст, то есть соответствует запросу с ее «точки зрения». Чем больше «нравится», тем с большей вероятностью этот контент написан ИИ.
Кроме того, современные алгоритмы в ответ на запрос делают не просто компиляцию из имеющихся текстов, но определенным образом видоизменяют, искажают их. И вот манеру и «стиль» нейросети тоже можно отследить — это увеличивает достоверность установления авторства: человек или программа.
В долгосрочной перспективе, говорит Митчелл, «предоставление учителям, читателям новостей и обществу в целом инструментов для проверки источника информации, которую они потребляют, всегда было полезным и остается таковым даже в эпоху ИИ».
Конец науки и образования? Все, что нужно знать о ChatGPT
Учимся лгать: инструменты ИИ умеют создавать дезинформацию
Что будет, если искусственный интеллект станет соперником человеку
Нейросеть показала, как выглядят бляха-муха, ёшкин кот и ядрёна вошь