Найти в Дзене
OVERCLOCKERS.RU

Проверяю систему анализа текстов и статей TEXT.RU

И опять: идея для статьи не моя. Я ее нагло подсмотрел в "непринужденной" беседе между нашим блогером Manager-ом и "первым Апшеронским ИИ" с многотысячными аккаунтами (имя ему Легион...)

-2

Суть спора: статьи допускаются до публикации, если соответствуют неким параметрам. Ну, понятно, что статья должна быть более-менее оригинальной, а не являться плагиатом. Хотя использование систем "ЧуДжиПукТи" спокойно проходит. Это я уже отлично увидел в текстах одного блогера...

Еще важны такие параметры, как "вода" и "заспамленность текста". А это что за "звери"?

Ищем информацию в "тырнете".

"Вода в тексте – это относительный показатель концентрации слов без смысловой нагрузки (стоп-слов). Слишком большой процент указывает на низкое качество материала. Поисковые системы хорошо ранжируют страницы с информативным контентом. Но это не значит, что водность нужно стараться свести к минимуму. Норма воды в тексте ограничена показателем 60 %".

"Заспамленность текста — это слишком частое повторение ключевого слова в тексте. Измеряется соотношением количества вхождений ключевого слова к общему числу слов в тексте. Заспамленность не должна превышать 60%. Тексты с высоким процентом заспамленности могут пессимизироваться поисковыми роботами (позиции понижаются за переспам), а при большом количестве аспамленных веб-страниц — сайт и вовсе могут забанить и он исчезнет из результатов поиска".

Это, конечно, интересно. Но каково это будет выглядеть в конкретных примерах? Интересно будет проверить на состоятельность подобных заявлений.

Сам я никогда до этого подобными ресурсами не пользовался, не доверяю я всяким ИИ (сразу вспоминается Скайнет). Ну а проверять собственноручно написанный текст на оригинальность, не имеет смысла.

А тут, была дана конкретная ссылка на ресурс. Почему бы и нет?

Скажу сразу: ресурс условно бесплатный. В сутки вы можете проверить на оригинальность и прочее, только определенное количество символов.

Проблем с проверкой на оригинальность не было вообще. Сайт достойно справлялся с данной задачей, верно указывая первоисточник. Но я и не пытался программу обмануть: не использовал немного переработанный "гуглоперевод" или подобное. Просто вставлял текст на русском и запускал проверку. Но меня больше заинтересовали параметры "вода " и "заспамленность". И вот тут вылез очень интересный момент...

Для начала, что написано об этих параметрах на самом сайте:

Как видите, в целом совпадает с тем, что я нашел в интернете. А как это выглядит в реальных текстах?

Для начала, пробую отрывок из своего рассказа, опубликованного на сайте:

-4

Вода - 21%, заспамленность - 39%. На количество ошибок можете не обращать внимание, тут многие системы не справляются. Хорошо у меня вышло или нет? Сказать однозначно не получится. Попробуем другой мой рассказ, но еще не опубликованный (модератор сказал: "пиши исчо дальше"):

-5

Вода - 18%, заспамленность - 38%. И опять ничего не ясно. Надо сравнить с авторами, которые пишут статьи профессионально. Для этого я взял статью с сайта АВТОРЕВЮ, написанную Андреем Васильевичем Хрисанфовым,

-6

одним из лучших авторов данной газеты, который, к сожалению, покинул наш бренный мир...

Его статьи про автомобили очень легко читаются. Проверим, что насчитал TEXT.RU:

-7

Вода - 25%, заспамленность - 36%... Хм... Адекватность проверки находится под вопросом... Если к своему "творчеству" трудно относится объективно, то уж тут профессионал высокого уровня. И довольно средние параметры. А точно, это что-то значит?

Усложняем задачу и переходим и отрывкам из классических произведений. Программа опять справилась с нахождением оригинала, но вот остальное...

Для начала, я решил поэкспериментировать с товарищем Говардом Филлипсом Лавкафтом

-8

и его романом "Хребты безумия". Фирменный "почерк" Лавкрафта тут присутствует. "Тягучий язык", множественные обороты. Короче читается не особо легко. А что нам скажет анализ текста:

-9

Вода - 32%, заспамленность - 31%. Ой! А что это наш Лавкрафт плохо пишет тексты! Ой, так не дело! Вода у него водянистая... А! Понял! Он же в своем творчестве много уделял внимание культу Ктулху.

-10

А он у нас живет в воде... Теперь все сходится! Ну не может же анализ ошибаться...

Проверим на другом авторе. Он тоже имеет мировую известность, но работал в другом жанре. Это Эрих Мария Ремарк

-11

с произведением "Черный обелиск" (музыкальный коллектив с таким же названием появился гораздо позже). Очень тяжелое, по сути, произведение. Не по написанию, а по наполнению смыслом. Кто читал, тот поймет.

-12

Вода - 21%, заспамленность - 58%. Опять не ахти. Причем, показатель заспамленности близок к критическим 60%. Значит, Ремарк тоже плохо пишет?

Проверим еще одного писателя с мировым именем. "Старик и море" - наверно, самое известное произведение Эрнеста Хемингуэя.

И опять вышло как-то не так: вода - 23%, а заспамленность - аж 65%. То есть такой текст неприемлем с точки зрения ИИ?

Ладно, будем считать, что писатели тут не виноваты, а все переложим на "бездарных переводчиков". Значит, проверяем русского писателя. Раз я задал довольно высокую планку авторов, то и среди русских писателей выберем незаурядного. Просто "столп русской литературы". Встречайте, Лев Николаевич Толстой, собственной персоной

-14

и его всемирно известный роман "Анна Каренина":

-15

Воды тут немного меньше - 17%, а вот заспамленность не "фонтан" - 40%. На перевод тут уже не спишешь. Значит и Лев наш подкачал?

Возьмем писателя рангом пониже, но отличающегося "восточной цветастостью" своего произведения. Речь о писателе Леониде Васильевиче Соловьеве

-16

и его произведении "Повесть о Ходже Насреддине".

-17

И в который (!) раз вода - 14% (пока это лучший результат), а заспамленность - 40%... И этот автор, с великолепным слогом и изложением, не "алё" по мнению электронного анализа...

А может все гораздо проще? Может просто подобные анализы не стоят и ломаного гроша? Как и все нынешняя реализация ИИ? Может эти алгоритмы подходят для простых "писулек" строго формального формата (о, как завернул)? Один раз я уже разочаровался в "интеллекте" ChatGPT. Он оказался абсолютно беспомощным в ответе на технические вопросы. И тут повторяется та же история. Ведь то, что считается "водой" и "заспамленностью", на самом деле фирменная черта писателя! Его стиль! И мы именно за это ценим их. Если же следовать "советам" подобных ресурсов, то у вас получится абсолютно убогий, ничем не выделяющийся текст. Может для ИИ это и хорошо, но мы же люди! Со своими взглядами и суждениями. И с какой радости нам следовать указаниям ИИ, которого сами и создали? Чтобы стать в конечном итоге болванчиками "неписей" из "божественного" "Старфилда"?

Одно успокаивает в этой ситуации: судьба людей, подвергнувшимся уничтожению Скайнета, нам не грозит...

P.S.: И, да: работать с фотографиями животных ИИ тоже не особо "могёт"...

-18

📃 Читайте далее на сайте