Специалисты из Тюбингенского университета (Германия) разработали метод, позволяющий выявлять научные статьи, созданные с помощью искусственного интеллекта (ИИ). Этот метод основан на анализе частотности слов, некоторые из которых буквально стали «вирусными».
Анализ частотности слов
В своей работе, опубликованной на сервере препринтов arXiv, исследователи проанализировали 14 миллионов научных трудов, опубликованных в базе PubMed с 2010 по 2024 год. Они обнаружили, что с широким внедрением генеративного ИИ в научную среду в 2023-2024 годах резко возросла частота использования некоторых слов и выражений.
«Вспышка эпидемии»
Ученые сравнили этот феномен с вспышками эпидемий, например, коронавируса, когда в научных статьях начинают чаще встречаться слова, связанные с заболеванием. Они выделили несколько «контрольных слов», употребление которых резко участилось в последние годы.
«Контрольные слова»
В своей работе немецкие ученые привели несколько примеров таких «вирусных» слов. К ним в частности относятся:
- Копаться (delves) — встречается в 25 раз чаще, чем до 2023 года.
- «Демонстрация» (showcasing) и «подчеркивание» (underscores) — в 10 раз чаще.
- «Потенциал» (potential) — на 4,1%.
- «Выводы» (findings) — на 2,7%.
- «Решающий» (crucial) — на 2,6%.
В апреле 2024 года сервис по обнаружению плагиата Turnitin сообщил, что за 2023 год более 22 миллионов научных работ, поданных студентами, были написаны с помощью ИИ. При этом обнаружить такой текст обычными методами крайне сложно. В связи с этим ученые считают, что использование ИИ в науке необходимо контролировать. Ведь чат-боты и модели ИИ могут генерировать ложную информацию, которую трудно отличить от правдивой.
The post Ученые сравнили ИИ с коронавирусом appeared first on Русская семерка.