Для начала скажу, что к Яндекс Дзен я имею минимальное отношение, но все же часть моих знакомых работают в этой системе и рассказывают мне про всякие непонятные штуки типа блокировок, ограничений и удалений каналов и лент rss. Моё безграничное чувство справедливости не позволяет пройти мимо, и, чтобы войти в тему мне пришлось изучить несколько топиков про Дзен на одном известном форуме https://searchengines.guru/showthread.php?t=992950&page=178.
Читал по диагонали, потратил ну может часика полтора, было интересно. Тезисы:
1 - Дзен несправедливо банит RSS ленты
2- Дзен несправедливо ограничивает каналы
3 - У Дзен есть список привилегированных и абсолютно неуязвимых сайтов. Эти сайты могут делать что угодно, и им ничего за это не будет.
Третий тезис для меня оказался самым интересным. Ведь если в системе рекомендаций есть сайты, которым можно нарушать правила, и сайты, которым это делать нельзя... ну это херя какая-то получается. Ну согласитесь - это в крайней степени несправедливо, и такую теорию нужно проверить. Ну что ж, нальем кружечку кофе и попробуем найти доказательства таким вот теориям и серьезным обвинениям.
Для этого нам нужно:
1- Сайт зарегистрированный в Яндекс Дзен с открытой статистикой хоть где-нибудь
2 - У этого сайта должна быть посещаемость выше 100 000 посетителей и расти на протяжении последних месяцев
3 - этот сайт должен быть сильно заспамлен рекламой
4 - контент этого сайта должен как минимум быть плохим рерайтом или явным копипастом
То есть мы ищем популярный сайт в Дзен, который ОЧЕВИДНО нарушает сразу несколько требований Дзен, и метрики которого мы сможем проанализировать. Спустя 30 минут пациент был найден. Factroom.ru на момент начала этого расследования занимал 4 место в рейтинге Дзен в разделе "развлечения" (сейчас уже нет). У этого сайта открытая статистика https://www.liveinternet.ru/stat/factroom.ru/index.html и его ежедневно посещают в среднем 200 000 человек. Что же это за сайт-то такой и почему он нам интересен? Для этого обратимся к правилам Дзен, которые гласят, что:
1) Нельзя размещать много рекламы на сайте;
2) Нельзя использовать чужой контент;
3) Нельзя использовать кликбейт;
4) У сайта должна быть весомая доля собственной аудитории.
Извините за сильное упрощение правил, я тут не подменяю понятия, я лишь хочу, чтобы данный текст было легко прочитать.
Заранее извините, что приходится разжевывать, самое интересное будет в конце.
Нельзя размещать много рекламы на сайте
Давайте подсчитаем кол-во рекламы на странице контента https://www.factroom.ru/entertainment/anekdot-o-tom-kak-evrej-dohlogo-osla-v-lotereju-razygryval . Пришлось открыть сайт с отключенным адблоком. Погнали:
Итого у нас на странице с одним анекдотом 17 рекламных объявлений, и одно из них видно всегда (большой плавающий блок справа).
Нельзя использовать чужой контент
Для этого мне понадобится гугл. Берем рандомно несколько страниц и проверяем их контент на уникальность. Я перехожу на страницы сайта напрямую из канала Дзен https://zen.yandex.ru/factroom, чтобы мы уж точно выбирали то, что в Дзен имеется
1) https://www.factroom.ru/entertainment/zanyatnye-anekdoty-chtoby-nachat-den-na-pozitivnoj-note?utm_referrer=https%3A%2F%2Fzen.yandex.com
Первый анекдот:
Привычка — это когда батареи отключили, а ты всё ещё вешаешь на них носки, в надежде на то, что они высохнут.
Второй анекдот (рамзещен в виде изображения):
Гугл показывает:
Третий анекдот:
— Алло, это ваше объявление — «Перетяжка мягкой мебели»?
— Да!
— Мне надо диван на дачу перетянуть!
Гуглим
Думаю, не стоит показывать каждый анекдот, уверяю вас, они также скопированы из интернета, если хотите - можете проверить. Я проверил все, все они скопированы.
Достаточно будет сказать, что такие вот подборки анекдотов - основной формат сайта, который замечается в Дзен (часто эти анекдоты упакованы в нарратив):
Нельзя использовать кликбейт
У Дзен очень обширное и расплывчатое понимание слова "Кликбейт". Мы будем опираться на краткое описание этого правила, которое сформулируем следующим образом: кликбейт - это заголовок, формирующий обманное представление о контенте, на который человеку предлагается кликнуть, либо совсем не раскрывающий сути этого контетна. Заголовок, созданный исключительно для увеличения количества кликов по нему.
На форуме SearchEngines неоднократно всплывала информация о блокировках каналов и RSS лент за кликбейт. В частности меня удивил случай, когда сайт был заблокирован за заголовок "14 причин не покупать йоркширского терьера", это был ироничный пост с выдуманными причинами типа "Никогда не покупайте йорка, так как он украдет ваше сердце" и тому подобное. Ироничный прикольный пост, но согласно правилам он создает обманчивое ожидание пользователя, и это кликбей. Я ничего не имею против, поэтмоу предлагаю посмотреть на наш любимый фактрум:
О чем нам говорят эти заголовки? Разве они раскрывают суть поста? Что такое "Плюс 100 к ловкости"? - что меня ждет перейдя по ссылке?
Заголовок конечно не создает обманчивое представление, скорее непонятное. Если углубиться в прочтение форума SearchEngines, то можно заметить, что один из пользователей полгода назад уже жаловался на сайт, и его блокировали именно за такой кликбейт. Хотите пруфы? - их есть у меня.
У сайта должна быть весомая доля собственной аудитории
Ну давайте посмотрим на статистику сайта:
За сентябрь сайт factroom посетили 9 500 000 человек:
5 680 000 - переходы из Яндекс Дзен
1 214 000 - переходы из главной страницы яндекса на Дзен (чаще всего, если следовать статистике других сайтов это кол-во примерно равно 15% общего трафика из Дзен). То есть это не переходы из поиска, а переходы с самой рекламы Дзен на главной странице поиска Яндекс. Выглядят такие посетители примерно так:
1 176 000 - переходы из Дзен
Итого мы получаем цифру в 8 060 000 посетителей из Яндекс Дзен, что является более чем 80% общего трафика сайта.
С пометкой "У вас слишком маленькая собственная аудитория" заблокирован ни один десяток, а может и сотня RSS лент.
Заключение
Пока я писал это "расследование", его читала моя знакомая, которая ведет несколько каналов в Дзен, и она вкратце изложив ситуацию написала об этом в техподдержку, на что получила такой вот ответ (от 22 августа):
........................................................................................................................................
Добрый день, Ирина!
Прошу прощения за ожидание.
Я понимаю ваше недоумение и отдельно благодарю за сигнал. Я отправлю сайт factroom.ru на дополнительную проверку.
Действительно, правилами Дзена запрещено использование чужих материалов в публикациях. Алгоритм Дзена постоянно обновляется и совершенствуется, чтобы избегать ситуаций, описанных вами (если действительно выяснится, что это копипаст) и создавать качественный контент. Но, к сожалению, от ошибок никто не застрахован.
Хотелось бы узнать, считается ли изменение формата подачи материала как подача уникального материала, и не карается ли такое?
Если мы говорим про перенос текста на картинку, то карается.
Если мы говорим в общем про рерайт (согласитесь, тоже некое изменение формы материала), то Дзен уже сформировал отношение к такому формату создания материала: мы ни в коем случае не ставим себе цель сделать копию существующего интернета — ведь мы и так уже добавляем тысячи источников-сайтов, на которых есть материалы разного уровня оригинальности и качества. На платформе мы поддерживаем уникальный, новый контент и боремся с низкокачественным неоригинальным материалом.
Если карается, то почему данный сайт не заблокирован в Дзен,
Как я писала выше, указанный сайт будет отправлен на проверку, с последующим применением необходимых мер.
если не карается, тогда получается скопированный текст, нанесенный на картинку не считается скопированным текстом?
Для алгоритмической системы к категории «чужой контент» относится любой контент, скопированный с других ресурсов и написанные другими лицами, даже на картинке, даже с указанием источника. У нас есть компьютерное зрение, анализируется все содержимое публикации, не только текст.
Если у вас остались вопросы - пишите, будем разбираться:)
С уважением, Мия
........................................................................................................................................
Прошло уже почти 2 недели, но сайт так и не заблокирован и никак не ограничен в Дзен, о чем говорит его статистика:
Коллега решила уточнить, и несколько дней назад снова спросила по поводу статуса перепроверки:
........................................................................................................................................
Добрый день, Ирина!
Перепроверка не показала нарушений?
Информацию о ходе проверки, о ее результате мы можем сообщать только владельцам сайта/канала.
Стоит ли полагать, что если этот сайт уже больше года растет, то все же Ваш робот (алгоритм) работает неверно?
Если сайт/канал действительно нарушает требования Дзена он будет ограничен в показах или заблокирован.
Я не могу комментировать ситуацию по статусу сайта, но уверяю, что в отношении вашей жалобы были приняты все необходимые меры.
С уважением, Мия
........................................................................................................................................
Какие из этого могут следовать выводы?
Ну как минимум, не все сайты одинаково чувствительны к нарушениям. Более того, некоторые сайты полностью неуязвимы не смотря ни на что.
Почему это плохо? А потому, что в системе рекомендаций не должно быть привилегий к тем или иным сайтам/авторам, только аудитория должна решать, что им читать, а что нет, СИСТЕМА же должна брать на себя обязанность очищать ленту пользователя от нарушающих правила СИСТЕМЫ сайтов/авторов.
Может быть СИСТЕМА решила, что данный сайт не нарушает никаких правил? - ну тогда прочитайте первое сообщение от техподдежрки, где черным по белому написано:
если не карается, тогда получается скопированный текст, нанесенный на картинку не считается скопированным текстом?
Для алгоритмической системы к категории «чужой контент» относится любой контент, скопированный с других ресурсов и написанные другими лицами, даже на картинке, даже с указанием источника. У нас есть компьютерное зрение, анализируется все содержимое публикации, не только текст.
Мы точно видим, что как минимум один сайт нарушает множество правил (хотя нарушение каждого из этих правил по отдельности уже является поводом для блокировки/ограничения), и не смотря на жалобы и внимание к нему (сайту) он остается на плаву и даже растет. Один ли такой сайт в Дзен? - конечно нет, их множество. Что могут делать авторы/каналы? - бороться с этим путем постоянного написания жалоб в техподдержку, как можно чаще стараться привлекать внимание к проблеме, иначе вы всегда будете в проигрыше.
Большое спасибо за внимание. Если в скором времени не будет никаких изменений касательно качества проверки Дзеном материалов, которые в нем находятся, я выпущу еще одно расследование про более крупный и заметный сайт, у меня времени много, мне делать нечего, могу посвятить этому несколько часов ежедневно. Добиваться равенства и справедливости - одно из самых привлекательных для меня занятий.
Запомните: этот сайт (многие другие) забирает ВАШИ деньги, боритесь с этим.
Всего...