Найти тему

Основы автоматизации рерайта, как повысить уникальность текста честным методом - перефразирование

Все, опубликованные в Интернет методы повышения уникальности, синонимизация, замена букв и т.д. как правило давно не работают. Достаточно хорошо работает рерайт, но это трудоемкий метод, и он не дает гарантированный результат, процентов уникальности, как правило не хватает.

Что такое рерайт, с точки зрения антиплагиата – это последовательности хешей (числовых значений). В компьютерной практике существует аналоговый вид предоставления текстов (то, что мы видим на экране) и цифровой (как это сохраняется на жестком диске). Цифровая среда оперирует цифровым предоставлением данных, это нужно учитывать при рерайте.

Самым популярным способом поиска плагиата выступает метод поиска шинглов, рис. 3:

- польский антиплагиат (Strikeplagiarism (Plagiat.pl)) ищет конгруэнтные шинглы, состоящие из 5 и 25 слов;

- Руконтекст ищет шинглы из двух слов, не применяя модуль поиска перефразирования;

- Антиплагиат ВУЗ ищет шинглы из 2 слов, применяя модуль поиска перефразирования (поиск рерайта) что занижает показатель уникальности, при отличии всех шинглов менее чем на 80%, примерно на 10-15%.

Рисунок 3- Шинглы из 3 слов
Рисунок 3- Шинглы из 3 слов

В этой связи актуален вопрос, как быстро сделать рерайт. Рерайтеры исходят из аналогового понимания процесса, видим слово или словосочетание – меняем. Я исхожу из цифрового понимания – есть шингл, например из 2 слов, он должен быть изменен. Мой подход рушит карту хещ значений текста, поэтому он эффективен.

Для реализации моего подхода нужен инструментарий, например я использую нейросетевое решение SEMANTICS. Если у вас нет под рукой нейросети, можно воспользоваться сборкой инструментов, которые существенно снизят трудозатраты рерайта.

Вам понадобится программа AntiPlagiarism.NET, в сети ее продают за 25 долларов, бесплатно скачать полнофункциональную версию можно здесь: https://www.etxt.ru/antiplagiat/ Как пользоваться программой, см. в Приложении 3.

Дополнительно вам потребуется переводчик GOOGLE: https://translate.google.ru/ и семантический анализатор текста, который умеет считать и ранжировать ключевые слова: https://tools.soltyk.ru/textanalyzer.php

Последовательность действий следующая, устанавливаем языки, исходный текст, вставляем в левое окно переводчика GOOGLE, полученный перевод, подвергаем обратному переводу, нажимаем на значок обратного перевода ТРИ РАЗА, рис. 4. Этот же исходный текст вставляем в правое окно программы AntiPlagiarism.NET (интерфейс: операции – сравнение текстов – метод обнаружение копий, количество шинглов – 2), рис. 5.

Рисунок 4 - Устанавливаем языки, исходный текст, вставляем в левое окно переводчика GOOGLE, полученный перевод, подвергаем обратному переводу
Рисунок 4 - Устанавливаем языки, исходный текст, вставляем в левое окно переводчика GOOGLE, полученный перевод, подвергаем обратному переводу
 Рисунок 5- Исходный текст вставляем в правое окно программы AntiPlagiarism.NET (интерфейс: операции – сравнение текстов – метод обнаружение копий, количество шинглов – 2)
Рисунок 5- Исходный текст вставляем в правое окно программы AntiPlagiarism.NET (интерфейс: операции – сравнение текстов – метод обнаружение копий, количество шинглов – 2)

Полученный, после тройного обратного перевода текст, вставляем в левое окно программы AntiPlagiarism.NET, нажимаем кнопку – сравнить, рис. 6. В итоге мы получаем карту шинглов, которая показывает шингловое отличие текстов – 51%.

 Рисунок 6– Получение карты шинглов, состоящих из 2 слов (карта Ш2)
Рисунок 6– Получение карты шинглов, состоящих из 2 слов (карта Ш2)

Интерес представляет текст, расположенный в левом окне программы AntiPlagiarism.NET. Скопируем его и вставим в WORD. Желтым цветом выделен текст, который не изменился, наша задача разбить желтые блоки, впечатывая по одному авторскому слову через один шингл, состоящий из 2 слов, рис. 7.

Рисунок 7– Результат разбивки желтых блоков, отличие текстов Ш2 составило 87%
Рисунок 7– Результат разбивки желтых блоков, отличие текстов Ш2 составило 87%

Давайте посчитаем, тройной обратный перевод дал снижение трудоемкости рерайта на 50%, из полученного объема мы допечатываем 30% текста. В объеме ВКР, имея 100 тыс. знаков (13 тыс. слов) мы снизили трудозатраты в 2 раза, к 50 тыс. проблемных знаков (7,5 тыс. слов) мы прибавили 1/3 – 2500 слов, которые в объеме знаков составят 16,6 тыс. знаков, или 8-10 стр. текста.

Можно ли снизить трудозатраты, да, конечно. Скопируем текст наших желтых блоков в буфер обмена и поместим в семантический анализатор текста, полученный ранжированный список ключевых слов, рис. 8, заменим методом найти и заменить.

 Рисунок 8– В итоге замен мы получаем отличие текста – 70%, рис. 9
Рисунок 8– В итоге замен мы получаем отличие текста – 70%, рис. 9
Рисунок 9– Частотные замены высокочастотных ключей
Рисунок 9– Частотные замены высокочастотных ключей

Впечатав на каждую 1000 знаков примерно 10 авторских слов, мы получаем необходимый показатель отличия текста – 81%, рис. 10.

Рисунок 10– Ручная разбивка 10% оставшихся шинглов
Рисунок 10– Ручная разбивка 10% оставшихся шинглов

Объединение методов обратного перевода и высокочастотных замен дает ок. 70% уникальности текста. Как видно из рис. 10 ручной работы остается не более 10 %. Мы снизили трудозатратность, в пересчете на ВКР, с 2500 слов, которые в объеме знаков составят 16,6 тыс., до 833 слов, 5,53 тыс. знаков.

_____________________________________________

ПОВЫСИМ УНИКАЛЬНОСТЬ ТЕКСТОВ, для любой системы проверки на ПЛАГИАТ, перефразируем и напишем «другими словами», за 1-2 часа, с ГАРАНТИЕЙ (предоставляется в день обращения), подробнее: https://kontrplagiat.ru/

ПОРЯДОК, СТАНДАРТ ОБСЛУЖИВАНИЯ

Оплата за результат, который вы видите, а не за обещание помощи: пришлите текст (как связаться, контакты) → через 30-60 мин., покажем результат рерайта (бесплатно предоставим пример текста из любого места работы, если качество текста устраивает, выполним проверку в антиплагиат, цена проверки 250 руб., предоставим скрин отчета, с показателем уникальности) → если качество текста и показатель оригинальности УСТРАИВАЕТ, оплачиваете → выдаем чек ФНС РФ + в течении 30-60 мин. отдаем уникальный текст + прилагаем отчет о полной проверке + предоставляем гарантию.