Найти тему
OVERCLOCKERS.RU

Детекторы GPT ошибочно помечают тексты неносителей английского языка

В статье, опубликованной 10 июля в журнале Patterns, исследователи сообщили, что компьютерные программы, обычно используемые для определения того, был ли текст написан искусственным интеллектом, имеют тенденцию ложно маркировать статьи, написанные не носителями языка, как созданные ИИ. Исследователи предостерегают от использования таких детекторов текста ИИ из-за их ненадежности, которая может оказать негативное влияние на людей, включая студентов.

«Наша текущая рекомендация заключается в том, что мы должны быть предельно осторожны и, возможно, стараться избегать использования этих детекторов», — говорит старший автор Джеймс Зоу из Стэнфордского университета. «Это может иметь серьезные последствия, если эти детекторы используются для проверки таких вещей, как заявления о приеме на работу, вступительные эссе в колледж или школьные задания».

Инструменты искусственного интеллекта, такие как чат-бот OpenAI ChatGPT, могут составлять эссе, решать научные и математические задачи и создавать компьютерный код. Педагоги в США все больше обеспокоены использованием ИИ в работе учащихся, и многие из них начали использовать детекторы GPT для проверки заданий учащихся. Эти детекторы представляют собой платформы, которые утверждают, что могут определить, генерируется ли текст искусственным интеллектом, но их надежность и эффективность остаются непроверенными.

Цзоу и его команда протестировали семь популярных детекторов GPT. Они проверили 91 эссе на английском языке через детекторы, написанное не носителями английского языка для широко признанного теста на знание английского языка, называемого TOEFL. Эти платформы ошибочно пометили более половины эссе как созданные ИИ, при этом один детектор пометил почти 98% этих эссе как написанные ИИ. Для сравнения, детекторы смогли правильно классифицировать более 90% эссе, написанных восьмиклассниками из США, как написанные человеком.

Цзоу объясняет, что алгоритмы этих детекторов работают, оценивая сложность текста, то есть то, насколько неожиданным является выбор слов в эссе. «Если вы используете общепринятые английские слова, детекторы выдадут низкий балл, что означает, что эссе, скорее всего, будет помечено как сгенерированное искусственным интеллектом. Если вы используете сложные и причудливые слова, то, скорее всего, алгоритмы классифицируют их как написанные человеком», – говорит он. Это связано с тем, что большие языковые модели, такие как ChatGPT, обучены генерировать текст с низкой степенью запутанности, чтобы лучше имитировать то, как разговаривает среднестатистический человек.

В результате более простой выбор слов, принятый авторами, не являющимися носителями английского языка, сделал бы их более уязвимыми для того, чтобы их пометили как использующих искусственный интеллект.

Затем команда поместила написанные человеком эссе TOEFL в ChatGPT и предложила ему отредактировать текст, используя более сложный язык, включая замену простых слов сложной лексикой. Детекторы GPT пометили эти эссе, отредактированные искусственным интеллектом, как написанные человеком.

«Мы должны быть очень осторожны при использовании любого из этих детекторов в обучающих заведениях, потому что все еще существует множество предубеждений, и их легко обмануть с помощью минимального редактирования», – говорит Цзоу. Использование GPT-детекторов также может иметь последствия за пределами сектора образования. Например, поисковые системы, такие как Google, обесценивают контент, созданный искусственным интеллектом, что может непреднамеренно оттеснить авторов, не являющихся носителями английского языка.

В то время как инструменты искусственного интеллекта могут оказывать положительное влияние на обучение учащихся, детекторы GPT следует дополнительно усовершенствовать и оценить перед вводом в эксплуатацию. Цзоу говорит, что обучение этих алгоритмов более разнообразным типам письма могло бы стать одним из способов улучшения этих детекторов.

📃 Читайте далее на сайте