Введение В данной статье напишем программу для проверки текста на плагиат. Конечно это не сравнится с хорошим антиплагиат сервисом, но для общего кругозора мы напишем свою простую программку. Проверка строки на плагиат Начнём с простого, и напишем программу, которая будет находить плагиат в строке. Для этого мы воспользуемся классом SequenceMatcher() из модуля difflib. В нём есть метод под названием ratio(), который возвращает схожесть нескольких последовательностей в виде числа с типом данных float и диапазоном от 0, до 1. Для начала импортируем класс SequenceMatcher(): from difflib import SequenceMatcher Теперь создадим две строки с +/- похожим текстом: from difflib import SequenceMatcher my_str = 'Привет, как дела?'
my_str2 = 'Привет, как жизнь?' Создадим объект класса SequenceMatcher() и передадим в него две наших строки: from difflib import SequenceMatcher my_str = 'Привет, как дела?'
my_str2 = 'Привет, как жизнь?' match = SequenceMatcher(None, my_str, my_str2) Осталось сравнить