Найти в Дзене

«Рерайтер» от «Сбера» против нейросети академического рерайта SEMANTICS КонтрПлагиат, повышение уникальности новостного текста

Оглавление

Продолжаем серию тестов «Рерайтера» от «Сбера», предыдущие тесты доступны по ссылкам ниже:

«Рерайтера» от «Сбера» и академический текст: https://kontrplagiat.ru/index.php/o-semantics/3948-sber-rerajter-i-semantics-kontrplagiat-sravnitelnyj-test-unikalnosti-i-kachestva-teksta

«Рерайтера» от «Сбера» и художественный тест, сказка про Красную Шапочку: https://vk.com/@kontrplagiat-er-sbera-rewriter-bredogenerator-ili-zapilivaem-novuu-versiu

Сегодня мы проводим тест: ««Рерайтера» от «Сбера» и новостной тест.

Напомним, что нейронные сети, используемые в онлайн-сервисе «Сбера», обучаются на генеративной модели rut5 с использованием материала различной длины, стилей и жанров: https://developers.sber.ru/portal/products/rewriter?attempt=1 Текстовые массивы для обучения состоят из источников новостей, обзоров и художественной литературы. Опираясь на текст источника «Рерайтер» «Сбера» переписывает текст на основе фактов (например, изменяя формы слов, подбирая синонимы и тезаурусы, клаузы и т.д.), чтобы создать новые предложения.

Для целостности эксперимента, в противовес «Рерайтеру» от Сбера мы противопоставим академическую нейросеть SEMANTICS КонтрПлагиат (https://kontrplagiat.ru/), которая, по мнению автора проекта – самая, самая лучшая и сидит в самом топе 5 известных нейросеток (результаты тестирования: https://kontrplagiat.ru/index.php/o-semantics/3954-povyshenie-unikalnosti-tekstov-rerajt-s-pomoshchyu-nejronnoj-seti-predostavlyaem-rezultaty-nejrorerajta-nejroset-semantics-kontrplagiat-sber-rerajter-ot-pao-sberbank-retext-ai-groupdocs).

Источник, новостной текст, опубликованный в РИА-новости

Текст источника, РИА Новости
Текст источника, РИА Новости

Текст источника:

«Перспектива, с которой нам предстоит иметь дело, предполагает для «Движения» роль оппозиции в следующей легислатуре. Я хотел бы заверить всех граждан, которые проголосовали за нас, что мы будем оппозиционной силой, которая проявит мужество и решимость, и будет сосредоточена на выполнении программы, которую мы выдвинули во время избирательной кампании», - сказал бывший премьер.

По его словам, работа «Движения» будет сконцентрирована на ликвидации экономического разрыва между южными и северными регионами Италии. Отдельно Конте указал, что «Движение» не позволит отменить так называемый гражданский доход - пособие для малоимущих и безработных, который был ключевым пунктом его экономической повестки.

Рерайт от «Сбера»

Интерфейс доступен по адресу: https://developers.sber.ru/portal/products/rewriter?attempt=1

Наш текст достаточно большой, для демо, поэтому разделим его на 2 части.

Рерайт от «Сбера», первые 500 знаков
Рерайт от «Сбера», первые 500 знаков

Рерайт от «Сбера», последующие 500 знаков
Рерайт от «Сбера», последующие 500 знаков

Текст после рерайта от «Сбера»: «Перспектива, с которой мы столкнемся в следующей легислатуре», означает для нас роль оппозиции во время избирательной кампании. Я хотел бы заверить всех граждан, которые проголосовало против меня (на референдум), что наша партия будет оппозиционной силой и сосредоточится на выполнении программы нашей партии, которую они выдвинули до выборов».

Конте заявил, что «Движение» не позволит отменить так называемый гражданский доход - пособие для малоимущих и безработных.

Отличие рерайта от «Сбера» от текста источника, проверка по шинглам, состоящим из двух слов, необходимо преодолеть порог – 81%.

Проверка текстов на отличие, метод шинглов, состоящих их двух слов
Проверка текстов на отличие, метод шинглов, состоящих их двух слов

Как видно из сравнения текстов, рерайт от «Сбера», не преодолел нужный порог уникальности, дефицит уникальности составил 21 %.

Текст после рерайта от SEMANTICS КонтрПлагиат

Текст, после рерайта SEMANTICS КонтрПлагиат
Текст, после рерайта SEMANTICS КонтрПлагиат

Текст, после рерайта SEMANTICS КонтрПлагиат: «Роль оппозиции будет заключаться в проведении кампании по выборам в следующий парламент. Я хочу заверить всех людей, которые проголосовали за нас, что мы будем смелой и решительной оппозиционной силой и что мы выполним программу, которую мы изложили в период выборов», - сказал экс премьер-министр.

По его словам, цель кампании - сократить экономическое неравенство между югом и севером Италии. В частности, Конте подчеркнул, что не допустит отмены так называемого «Дохода гражданина», пособия для бедных и безработных, поскольку это движение является важным элементом экономической программы.

Проверка текстов на отличие, метод шинглов, состоящих их двух слов
Проверка текстов на отличие, метод шинглов, состоящих их двух слов

Вывод

Изменение объема текста

Исходный текст: 705 знаков.

Рерайтер от «Сбера»: 468 знаков, реферирование текста – 33,61%

SEMANTICS КонтрПлагиат: 596 знаков, реферирование текста – 15,46%

Процент отличия текста по методу шинглов, прогноз повышения уникальности

- Как видно из сравнения текстов, рерайт от «Сбера», не преодолел нужный порог уникальности, набрано – 60%, дефицит уникальности составил 21 %.

- Как видно из сравнения текстов, рерайт от SEMANTICS КонтрПлагиат, преодолел нужный порог уникальности, набрано 93%, запас уникальности составил 13 %.

Читабельность текста, наличие неточностей

Рерайтер от «Сбера»:

1. Перспектива, с которой мы столкнемся в следующей легислатуре – потеря смысла.

2. означает для нас роль оппозиции во время избирательной кампании – потеря смысла.

3. которые проголосовало против меня (на референдум) – грубая потеря смысла, ошибка

4. наша партия будет оппозиционной силой и сосредоточится на выполнении программы нашей партии – тавтологический круг.

5. Конте заявил, что «Движение» не позволит отменить так называемый гражданский доход - пособие для малоимущих и безработных – существенное реферирование, потеря ключевых смыслов.

Рерайт от SEMANTICS КонтрПлагиат

1. Дохода гражданина – по тексту источника – это гражданский доход.

Обсуждение результатов

В сумме трех показателей Рерайтер от "Сбера" показал существенно худший результат, полученное отличие текста - недостаточное (60%, вместо 81%), объем текста, уменьшился на 33%, что недопустимо при рерайте текстов критичного объема, читабельность текста - достаточно низкая, присутствует большое количество ошибок, в том числе и грубых.

SEMANTICS КонтрПлагиат, лучшая отечественная, академическая НейроСеть рерайта и перефразирования, приглашает скептиков протестировать возможности НейроРерайта, 2000 знаков - бесплатно: https://kontrplagiat.ru/