Найти тему
ВелоQuiz

Как определить накручивалось ли интернет-голосование?

Оглавление

Мы уже писали о том как приняли участие в конкурсе любительских спортивных проектов "Ты в игре", и о том какие аномалии роста голосов мы зафиксировали в последние 3 дня народного голосования за лучший проект. Разобрали неудачные попытки накрутки голосов некоторых участников. Теперь пришло время для подробного анализа поведения тех, кто накручивал, но избежал кары администраторской.

Итак, напомним, что примерно через неделю после старта голосования за лучший проект мы обратили внимание на то, что некоторые участники "растут" слишком быстро относительно остальной массы. При этом никаких предпосылок для такого роста (типа прокачанных аккаунтов в соцсетях) за ними замечено не было. Со временем таких "скакунов" стало уже несколько, а порой случалось и такое, когда резко поднявшегося участника администраторы вручную возвращали на его реальные позиции, списывая пачку из нескольких тысяч голосов.

Когда за этой чехардой проектов в топе стало сложно следить, мы стали снимать итоги голосования первых 40 участников через каждые пол часа и аккуратно записывали данные в отдельные файлики. Таким образом мы получили 40 графиков движения к победе каждого из лидеров голосования продолжительностью в 3 дня.

Если раньше у нас были только подозрения в том, что кто-то ведёт борьбу не очень честно, то теперь картина стала очень наглядной.

График динамики голосов за лидеров голосования в последние 3 дня
График динамики голосов за лидеров голосования в последние 3 дня

Для нас, глядя на график, становится очевидным, что подавляющее большинство участников здесь двигаются к победе недобросовестно. Все отмеченные нами на графике случаи мы однозначно считаем накрутками. Потому что такое поведение голосующих неестественно. И это понятно любому специалисту, который хоть раз анализировал интернет-трафик.

Скачок на графике - накрутка или нет?

Практически каждый из отмеченных участков обладает всеми следующими характеристиками:

  1. Рост голосов более, чем на 100 пунктов одним рывком Подобный рост всегда вызван каким-то событием. При том событие должно затрагивать большую аудиторию. Сложно представить мероприятие, на котором абсолютно каждый из участников достанет смартфон из кармана, сразу зайдёт на нужный сайт и проголосует за кого скажут. Допустим, пусть даже аудитория суперлояльна, но у кого-то телефон разрядился, у кого-то интернет не ловит, кому-то тупо лень, а у кого-то "простая звонилка" вместо смартфона. А в данном случае кому-то из присутствующих ещё и может попасться IP-адрес, с которого уже голосовал кто-то другой. Таким образом, для получения 100 голосов нужна аудитория в разы больше, чем 100 человек. А такое мероприятие, как правило требует серьёзной подготовки и планирования. Немногие могут позволить себе такое каждый день.
  2. Характер роста - линейный На каждом 30-минутном интервале "всплесков" мы видим примерно одинаковый прирост голосов. Так в реальной жизни с людьми просто быть не может. Всегда есть какой-то пик активности и снижение темпа - люди же, голосуя в интернете, не становятся в очередь.
  3. Отсутствие "инерции" после всплеска активности Голоса внезапно начинают расти и так же резко останавливаются. От живых людей после пика активности, как правило идёт небольшое "эхо", продолжающее рост как минимум на протяжении ближайших двух часов - кто-то не запомнил адрес сайта с голосованием и пришлось погуглить, кто-то зашёл на сайт, но проголосовал не сразу, кто-то сделал репост друзьям. В общем, естественные всплески трафика всегда инертны и на графике не будут иметь форму ровной линии. Здесь же мы видим чёткие начало и завершение активности, как по команде.

Каждый из этих признаков даже по отдельности заставляет насторожиться. А при совместном проявлении они со 100% вероятностью указывают на то, что эти голоса пришли не от настоящих людей.

Если бы мы имели доступ к журналам обращения к серверу или хотя бы к статистике посещений, уверены, что все наши догадки подтвердились ещё и кучей подозрительных запросов к сайту с зарубежных IP-адресов и/или отсутствием этих пользователей в статистике.

Ну зачем же ночью-то?

Наверное, вы заметили эти жёлтые вертикальные зоны на каждом графике - периоды с 21:00 по 1:00 по Гринвичу. Это глубокая ночь по часовому поясу Москвы (0:00 - 4:00 MSK). В это время естественная активность голосующих должна если не отсутствовать, то очень заметно снижаться.

Это касается не только Москвы. В то же время, например, в Иркутске 5-9 часов утра. Там тоже все нормальные способные проголосовать люди либо ещё спят, либо только-только просыпаются и просто физически не могут в едином порыве дать проекту несколько сотен голосов.

Даже если об участнике конкурса расскажут в утреннем телешоу по "Первому", активность голосующих не может на протяжении двух часов быть такой равномерной как у участника №1. В подобной ситуации должна быть очень короткая (возможно даже высокая) "ступенька", которая совершенно точно уложится в 30-минутный интервал (пока идёт сюжет).

Динамика набора голосов участником №1
Динамика набора голосов участником №1

Наш герой №1 живёт как раз по московскому времени и его самый заметный вброс пришёлся на время примерно с 0:30 до 2:30. Два часа среди ночи очень равномерно (по 50-55 голосов каждые пол часа) кто-то голосовал за единственный проект как минимум из 40 ближайших к нему конкурентов. Может авторы этого проекта не пускали посетителей в какой-то ночной клуб пока те не проголосуют за них? Или, наоборот, не выпускали...

А днём... Что перед этим, что после - всего по 5-7 голосов. За целый день, Карл!!! Видимо, отсыпались после трудной ночи.

Также выглядит очень подозрительной сумма накрученных голосов этим участником за последние 3 дня: 520 + 250 + 230. Тысяча! Совпадение? Пусть будет так. Но зачем накручивать в последний день, если ближайший конкурент находится позади тебя как минимум в двух сотнях голосов? Чтобы не пропадал остаток оплаченного "пакета"?

Быстрые и дерзкие

Помните печальную историю проекта №25, который нарастил примерно 800 пунктов за 7-е марта, а потом был жестоко лишён почти всех голосов за три предыдущих дня?

Динамика набора голосов участником №4
Динамика набора голосов участником №4

4-й участник в тот же день практически в то же время получил 850 голосов. Только действовал он гораздо более дерзко. Если голоса первого несчастного добавлялись плавно в течение всего дня, то этому счастливчику для большего объёма хватило всего 1,5 часов!

И никаких санкций со стороны администрации. Видимо, чем более дерзкий вброс, тем больше шансов, что его не заметят или посчитают нормальной активностью голосующих.

А может всё-таки это не вбросы?

Может. Давайте дадим шанс участнику №6. У него есть самый наименее подозрительный скачок практически перед самым закрытием голосования: за 3 часа на 100 голосов.

Динамика набора голосов участником №6
Динамика набора голосов участником №6

Мы уже представляли пару сценариев набора такого количества голосов несколькими абзацами выше. Давайте попробуем ещё...

Может быть кто-то в это время вышел на улицу и каждые 2 минуты находил одного прохожего, который тут же за них голосовал. Или за 3 часа обзвонили сотню хороших знакомых, которые не могли отказать им в помощи (помним, что голоса по сценарию должны появляться в среднем каждые 2 минуты). Какой-то бред, не находите?

Нам так и не удалось придумать ни одного адекватного способа как можно равномерно на протяжении нескольких часов получать голоса от реальных людей при этом внезапно начав и так же резко остановив их поток. Если кто-то знает такие, прямо сейчас опишите хотя бы один в комментариях ниже.

Почти "законные" способы накрутки

Однако примерно такой же график голосов может появиться вследствие использования инструментов интернет-рекламы с оплатой за клик . Например, Яндекс.Директ, Google AdWords, реклама в Instagram, VK, Facebook и т.д.

Они могут привести на нужную страницу достаточно большое количество посетителей в любой выбранный промежуток времени. И эту рекламу можно в любой момент запустить или остановить.

Единственным минусом этого способа можно назвать то, что каждый переход каждого посетителя должен быть оплачен, но выполнит ли он на странице нужное действие - никакой гарантии нет. А если даже и нажмёт кнопку "Проголосовать", не факт, что его голос примут (мы ведь помним, что с каждого IP голосовать можно только один раз).

Даже при идеальных условиях и самых дешёвых переходах каждый посетитель (но не голос) из Яндекса будет стоить 3 рубля. Но для того, чтобы обеспечить более 100 переходов за 3 часа, скорее всего ставки придётся поднимать как минимум раза в 2-3. С другими рекламными системами примерно то же самое. Плюс нужно учитывать стоимость настройки рекламной кампании (обычно от 5000 р.). Ради 100 голосов с этим заморачиваться явно никто не будет. Но на весь срок голосования вполне можно и сделать.

Один голос полученный подобным способом будет стоить как минимум рублей 10. Для конкуренции за место в 1-й десятке, где у каждого более 3000 голосов, получается, требовалось вложить в рекламу как минимум 30 000 рублей. При таких расходах даже если выиграешь, выгода весьма сомнительна.

Но может быть для кого-то деньги не главное. Вполне вероятно, что как раз таких ребят мы видим на 5-й и 8-й позициях. Их динамика вполне соответствует этой версии - равномерный продолжительный и активный рост предполагает постоянное привлечение аудитории, вероятнее всего при помощи рекламы.

Динамика набора голосов участниками №5 и №8
Динамика набора голосов участниками №5 и №8

Это сложно назвать накруткой - в результате рекламной кампании голосуют реальные люди и, вероятнее всего, по собственному желанию. Но на месте администратора сайта мы бы всё же проверили этих участников на предмет хитрости.

Кстати, есть ещё один схожий (и более гарантированный) способ получить стабильный активный рост голосов - использование сервисов выполнения платных заданий . Стоимость одного голоса в таком случае может начинаться от 1,5 рублей. Голоса будут "настоящими" и графики получатся более естественными. Но администратором сервера подобная активность и её источники, как правило, могут быть вычислены очень просто. Не исключаем, что кто-то использовал и такой способ набора голосов, однако ничего общего с народным волеизъявлением у него нет. Это самая настоящая накрутка.

Хоть кто-то честный там есть?

Все хотели победить. Многие не сидели сложа руки и использовали для этого все доступные средства. У кого-то получилось, у кого-то - не очень. Но накрутки, а особенно в голосовании за спортивные проекты - это всё равно что "срезать" через забор на марафоне - неспортивное поведение, которое на наш взгляд должно наказываться дисквалификацией.

Мы уверены в том, что подавляющее большинство участников (а может и каждый) с итоговым количеством голосов более 2000 использовали механизмы автоматической накрутки. Даже те, у кого в последние дни графики получились абсолютно ровными, по нашим наблюдениям не раз до этого проявляли признаки использования вбросов.

И что же делать?

Если собираетесь проводить какое-то серьёзное голосование претендующее на честность, не поскупитесь на адекватную защиту от накруток. Полностью предотвратить мухлёж, разумеется, не получится. Но вполне можно свести к минимуму возможности вбросов. А если должным образом подготовиться, то можно легко отследить недобросовестных участников и исключить их из борьбы на самых ранних стадиях.

Если интересно узнать как именно это сделать - ставьте лайк и подписывайтесь! Как только эта статья соберёт 1000 лайков, мы напишем как подготовить и провести максимально честное голосование на своём сайте без необходимости регистрации участников.