Оценка исследовательских коллективов и отдельных ученых в России в первую очередь определяется их публикационными результатами, с особым акцентом на количестве опубликованных статей и диссертаций [1]. Такие количественные показатели являются неотъемлемой частью оценки академической производительности. Однако, помимо простых цифр, улучшение общего качества этих публикаций играет решающую роль в повышении эффективности как науных публикаций, так и образования в стране. Ключевым показателем качества публикации является минимальное количество плагиата, которое все чаще признается как существенный компонент поддержания академической честности [2, 3]. Плагиат, традиционно понимаемый как неправильное цитирование чужой работы, теперь охватывает более широкий спектр неэтичных практик. В своем расширенном определении плагиат включает преднамеренное и незаконное присвоение идей, результатов или семантического содержания другого человека, ложно представленное как оригинальная работа [4, 5]. Интересно, что хотя заимствование определенных идей или семантического содержания формально не квалифицируется как плагиат, поскольку эти элементы не защищены авторским правом, это привело к растущей дискуссии о границах законного академического заимствования [2, 6].
В последние годы научное сообщество все больше обеспокоено ростом числа неверных цитат и ненадлежащих ссылок, особенно в диссертациях. Такая практика, если ее не контролировать, может подорвать доверие к академическим исследованиям [7]. Сообщество «Диссернет» своими целенаправленными усилиями внесло значительный вклад в повышение осведомленности об этих проблемах цитирования в российской академии. Их работа подчеркивает важность решения проблемы ошибок цитирования и плагиата в научных публикациях [7].
Для борьбы с этой проблемой современные технологии, в частности интернет-инструменты обнаружения плагиата, сыграли ключевую роль. Такие системы, как «Антиплагиат», «Адвего Плагиатус» и другие, значительно упростили выявление текстовых совпадений между работой автора и уже существующими текстами. Эти системы работают, сравнивая исследуемый текст с широким спектром индексированных источников, выявляя пересечения и вычисляя степень заимствования [8, 9]. Такие системы оценивают три ключевых показателя: заимствование, цитаты и оригинальность, которые в совокупности обеспечивают комплексную оценку целостности документа [10].
В ответ на растущую угрозу плагиата Высший совет по аккредитации постановил, что диссертации должны быть свободны от любой формы плагиата. Аналогичным образом национальные научные журналы и университеты приняли строгие правила, чтобы гарантировать, что все курсовые работы и выпускные проекты являются оригинальными, что усиливает важность этического академического поведения [11, 12, 13]. Тем не менее, несмотря на эти строгие меры, проблемы сохраняются. Автоматизированные системы антиплагиата иногда ошибочно определяют общепринятые научные выражения и законы как плагиат. Это привело к трудностям для исследователей, поскольку устоявшаяся академическая терминология может быть помечена неправильно, даже если она используется надлежащим образом в научном контексте.
Поскольку зависимость от цифровых инструментов продолжает расти, баланс между механическим применением правил плагиата и необходимостью академической гибкости стал постоянным разговором. Правильное решение этих вопросов будет иметь важное значение для сохранения целостности академической работы, позволяя ученым опираться на общие научные знания без ненужных санкций.
Системы обнаружения плагиата стали распространенным инструментом оценки научных работ, особенно благодаря простоте использования и возможности применять формальные критерии [14]. При правильном использовании эти системы могут помочь оценить качество публикации, выявляя потенциальные случаи плагиата. В результате обнаружение плагиата стало одним из центральных критериев практической оценки научных работ [14]. Однако растущая зависимость от инструментов борьбы с плагиатом привела к непреднамеренным последствиям. Чрезмерная диагностика, когда даже незначительные текстовые совпадения помечаются как плагиат, стала существенной проблемой [10]. Несмотря на рекомендации разработчиков систем обнаружения плагиата о том, что эти инструменты служат только в качестве вспомогательного средства для выявления заимствований и что определение авторства должно оставаться обязанностью эксперта, часто наблюдается чрезмерная зависимость от автоматизированных результатов [10].
Исторически существовала недодиагностика плагиата, когда минимальная проверка позволяла не замечать существенные совпадения. Однако сегодня ситуация изменилась, и почти любое текстовое сходство классифицируется как плагиат, независимо от контекста. Хотя системы защиты от плагиата играют важную роль в обеспечении академической честности, их способность точно отражать оригинальность научной работы ограничена механической природой их оценок. Такая чрезмерная диагностика плагиата может исказить истинную ценность научных вкладов, поскольку она не учитывает более широкую цель исследования [15]. Действительно, основные элементы научной работы — ее новизна, решаемые ею проблемы и надежность данных — являются гораздо более важными показателями качества, чем простое совпадение фрагментов текста [15].
Например, системы обнаружения плагиата могут отмечать незначительные текстовые сходства, такие как расстановка запятой в предложении, как плагиат. Эти системы часто упускают из виду тот факт, что общий смысл предложения может быть совершенно разным, несмотря на повторение слов или фраз [15]. Это приводит к ложным срабатываниям, когда незначительные текстовые совпадения рассматриваются как плагиат, хотя они и вносят вклад в совершенно новый и оригинальный смысл. Такие механические оценки не учитывают должным образом нюансы научного письма.
Более того, бывают случаи, когда исследователи, работающие в одной и той же области, повторно используют разделы своей предыдущей работы, чтобы сохранить целостность и преемственность своей исследовательской перспективы. Эта практика, известная как самоцитирование, представляет собой еще одну проблему в соответствии с текущими стандартами обнаружения плагиата. Самоцитирование может быть помечено как плагиат, несмотря на то, что оно является естественной частью научной работы, где не все результаты могут быть совершенно новыми [16]. Аналогичным образом, промежуточные публикации, которые часто охватывают основные выводы исследовательского проекта, могут значительно пересекаться с окончательной работой. Это совпадение, хотя и необходимо для отражения прогресса исследования, еще больше усложняет оценку оригинальности.
Текущая картина академической оценки нуждается в более сбалансированном подходе. Хотя системы антиплагиата играют важную роль в предотвращении неэтичных практик, необходимо признать их ограничения. Обеспечение академической честности не должно осуществляться за счет игнорирования истинного научного вклада. Вместо этого необходимо принять более тонкое понимание плагиата и оригинальности, которое учитывает сложность современных исследовательских практик и допускает законное повторное использование материала в соответствующих контекстах.
В академических публикациях все более заметной становится проблема представления ранее описанного материала без нарушения правил плагиата. Исследователи часто оказываются обвиненными в плагиате, несмотря на соблюдение стандартов цитирования [17]. Прямые цитаты, которые обычно требуют предварительного одобрения и изменения в соответствии с правилами подачи, не всегда возможны. Даже при использовании самоцитирования системы обнаружения плагиата имеют тенденцию помечать контент как заимствованный, что усложняет процесс. Кроме того, некоторые журналы налагают ограничения на цитирование собственных работ, еще больше сужая возможности для надлежащего указания ссылок на предыдущие исследования. Более разумным подходом было бы исключить совпадения, включающие менее определенного процента (например, 30%) предыдущих работ исследователя, из классификации как плагиат.
Действующие правила КонтрПлагиата требуют, чтобы текст из других источников был заключен в кавычки и сопровождался надлежащими цитатами. Однако, когда дело доходит до косвенных цитат или частичных цитат, эти правила представляют сложности. Если косвенные цитаты не обозначены четко, они помечаются системами обнаружения плагиата как заимствованный материал. Такая ситуация препятствует использованию косвенных цитат, затрудняя интеграцию ранее обсуждавшихся идей в новые работы без нарушения этих правил. Следовательно, это значительно снизило возможность представления тонкого материала, где для контекстной связности необходима небольшая перефразировка.
В дополнение к этим проблемам, системы проверки плагиата часто идентифицируют общие выражения, устоявшиеся научные законы и широко известные закономерности как плагиатный контент. Такие системы не различают общепринятые знания и действительно скопированный материал, что поднимает вопросы о необходимости переписывания общеизвестных научных фактов, таких как теорема Пифагора (Pythagoras theorem) или коэффициентный показатель корреляции [17]. Это приводит к повторному перефразированию общеизвестных определений, проблема, особенно очевидная в студенческих работах, где давление с целью прохождения проверки на плагиат приводит к неловким и неестественным формулировкам [18]. Эти системы, разработанные для предотвращения академической нечестности, не анализируют глубокий смысл текста, в результате чего стилистические или фразеологические элементы ложно определяются как плагиат.
Основной проблемой систем антиплагиата является длина совпадающих последовательностей слов. Отсутствие ясности относительно минимально допустимой длины совпадающих последовательностей вызывает опасения относительно точности обнаружения плагиата. Например, последовательности из менее чем 7-10 слов, которые совпадают между текстами, особенно если они включают общие фразы, не должны быть помечены. Это поможет сократить количество ложных срабатываний и позволит более точно определить фактический плагиат.
Стандарты плагиата не являются едиными для всех журналов. Некоторые допускают до 40% текстового совпадения, в то время как другие более строгие, требуя менее 10% совпадения. Требование к проценту оригинальности в 80%, предъявляемое некоторыми публикациями, представляет собой проблему для авторов, особенно при проведении исследований на основе устоявшихся методологий или предыдущих результатов. Достичь столь высокого уровня оригинальности часто можно только вручную, что накладывает дополнительную нагрузку на исследователей. Например, в таких областях, как компьютерные науки, повторное использование результатов предыдущих исследований является неотъемлемой частью научной работы, что приводит к снижению оценок оригинальности в соответствии с действующими стандартами плагиата [8]. Следовательно, существует настоятельная необходимость в более гибких правилах, которые будут учитывать итеративный характер научных исследований, сохраняя при этом целостность академических публикаций.
Использование механизмов проверки на заимствование в академическом письме стало как важным, так и вызывающим затруднения. Эти механизмы часто устанавливают строгие ограничения в отношении заимствованного материала, но растет осознание того, что определенная доля заимствований должна быть допустимой, в частности, 15–20%, чтобы сохранить непрерывность академической дискуссии. В то же время неправильное использование крупных, нецитированных фрагментов из трудов других авторов остается неприемлемым, а лимит на предельный объем дублирующегося материала, например, объем 300–400 символов, было бы разумным решением для урегулирования этой проблемы.
Механизмы проверки на заимствование также должны быть более гибкими и адаптируемыми. Алгоритмы обязаны учитывать специфические особенности анализируемого материала, включая научную область, к которой принадлежит исследование, поскольку разные дисциплины могут требовать отличающихся подходов к обработке цитирования и ссылок. Более того, авторам необходимо предоставить больше контроля над тем, как система интерпретирует их работы. Например, в случае, если меньше 30% формулировки взято из предыдущих публикаций автора, она не должна помечаться как заимствование. Этот подход предоставит большую гибкость в вопросах самоцитирования, гарантируя, что ученые смогут использовать свои прежние исследования без опасения получить наказание.
Помимо корректировки порогов для самоцитирования, должна быть обеспечена большая гибкость в сопоставлении текста. Система не должна помечать формулировки как заимствование, если менее 66% формулировки соответствует другому источнику. Это поможет различить законное использование общепринятого академического языка от реального заимствования. Кроме того, введение продуманного процесса апелляции, включающего экспертную оценку, позволит авторам оспаривать выводы механизмов проверки на заимствование, обеспечивая сбалансированность автоматизированных решений и человеческого анализа.
Несмотря на эти проблемы, важно осознавать, что присутствие заимствования — это лишь один из аспектов оценки академической работы, и ему не следует придавать чрезмерное значение. Самое важное в научной работе — это вклад новых идей, а не избежание всех возможных совпадений в формулировках. Чрезмерная зависимость от механических методов борьбы с плагиатом, которые отдают приоритет формальному обнаружению над содержанием, усложняет процесс написания и создает ненужные барьеры для исследователей. Научную работу следует оценивать по ее интеллектуальному вкладу, уделяя меньше внимания созданию совершенно новых словосочетаний в ущерб ясности.
Системы борьбы с плагиатом часто неправильно диагностируют заимствования из-за своей неспособности интерпретировать смысл текста. Так например, стилистические элементы или общеупотребительные фразы помечаются без понимания их контекстной значимости. Такая чрезмерная диагностика усложняет процесс академического письма, и зависимость от этих механических методов оказалась скорее препятствием, чем поддержкой для ученых. Следовательно, для устранения недостатков формальных методов обнаружения необходим более сбалансированный подход, включающий четкие критерии того, что составляет плагиат. Снижение механической жесткости этих систем и акцент на экспертной оценке обеспечили бы лучшую основу для выявления законного академического заимствования, одновременно поддерживая создание оригинального научного контента.
___________________
КонтрПлагиат, текст перефразирован с отличием Ш2=100%, источник: Гельман В.Я., Проблемы формально-механистического подхода к выявлению плагиата в научных работах
Другие наши публикации
Антиплагиат в зарубежных университетах
Антиплагиат проверка оригинальности ВКР (выпускных квалификационных работ)