Найти тему
Александр Логинов

Как определить накрутку посещаемости. Кейс.

Оглавление

Краткая предыстория

Мы получили новый сайт на продвижение. Типичная ситуация: знакомые им занимались, но ничего не сделали. На сайте отсутствуют даже вменяемые тайтлы у основных категорий, про остальные мета-данные и технические ошибки можно и не говорить. Случай, когда для нерадивого сеошника вся работа состоит в получении денег и составлении отчета для нас к сожалению не удивителен.

Интересное начинается на следующий день после переговоров. Суббота, вечер, звонок от клиента. Краткая суть: куда пропала моя посещаемость? Было по полторы тысячи человек, а сегодня только 10. Удивлению нет предела, откуда у сайта в таком состоянии такой трафик. Первая мысль - переходы ботов, парсящих товары. Но клиент уверен, что это люди из поиска. Запрашиваем доступы к метрике и приступаем к расследованию.

В этом разговоре, клиент высказывает свои подозрения, о том, что, возможно, с его старым подрядчиком дело нечисто. Ведь покупателей с сайта должно быть больше, чем 3-4 в месяц.

Расследование

Первая улика

При просмотре данных метрики первое, что бросается в глаза – необычное распределение пользователей по поисковым системам. Для текстильной тематики (впрочем, как и для большинства коммерческих сайтов) типичное распределение 60-70% пользователей из Яндекс, 30-40% пользователей из Google.

Аномальное количество переходов из непопулярных поисковых систем.
Аномальное количество переходов из непопулярных поисковых систем.

В данном случае мы наблюдаем 25% - яндекса, 24.4% - google, 15.6% - Yahoo!, 14.6% - Mail.ru, 14.5% Rambler.

Это удивительная аномалия, которая с очень большой долей вероятности свидетельствует о накрутке трафика. На этом же скриншоте видны следующие признаки накрутки:

1) Количество визитов равно количеству посетителей, глубина просмотра 1.1 – значит пользователи практически не переходили на другие страницы сайта. У живых людей так не бывает, когда речь идет о многостраничных сайтах.

2) Процент отказов слишком низкий. Как правило, процент отказов в 10% считается неплохим.

Для наглядности скриншоты аналогичных отчетов из других сайтов этой же тематики.

Обычная картина 1
Обычная картина 1
Обычная картина 2
Обычная картина 2

Глубина просмотра значительно выше, Из рамблера, мэйл.ру и yahoo практически нет переходов, количество визитов превышает количество посетителей. Количество переходов из Яндекс вдвое больше, чем переходов из Google.

Улика вторая. Роботность.

Подозрения усилились. Даже с первого отчета метрики видны сразу несколько подозрительных статистических параметров, но о них позже. Пришло время воспользоваться одним из самых редких атрибутов статистики метрики - мы добавляем столбец Роботность.

Атрибут – роботность показывает вероятность того, что посетитель на сайте был роботом. Для переходов по ссылкам и прямым переходам на сайте роботность в пределах 10-30% может быть нормальной. Многие таким способом собирают информацию о ценах и товарах.

Но для поисковых систем роботность не должна быть выше 10%.

Роботы заполонили интернет и проявляют особый интерес к нашему сайту.
Роботы заполонили интернет и проявляют особый интерес к нашему сайту.

Показатель «роботность» - 56%. С учетом того, что алгоритмы яндекса могут допускать погрешность при вычислении данного параметра, в реальности роботов может быть более 90%.

Для наглядности показатели сайтов без накрутки.

У нормального сайта роботность 3.75%
У нормального сайта роботность 3.75%
У второго сайта роботность и того ниже - 1.2
У второго сайта роботность и того ниже - 1.2

Мы видим, есть процент роботов, которые заходят на сайт напрямую, из соц. сетей, по ссылкам в каталогах. Но эти роботы не пытаются изображать переходы из поиска или по рекламе.

Улика третья. Мобильные устройства.

Следующий аномальный параметр – распределение по типам устройств. В последние годы количество посетителей со смартфонов может превышать количество пользователей с ПК. Здесь же мы наблюдаем картину образца 2010 года.

Всего 1% пользователей пользуется мобильными устройствами. Хоть кто-то вернул себе 2007 год.
Всего 1% пользователей пользуется мобильными устройствами. Хоть кто-то вернул себе 2007 год.

На графике есть два периода, когда накрутка отключалась. В эти дни доля пользователей со смартфонов превышала 60%.

Также можно отметить, что процент отказов и глубина просмотра на планшетах значительно лучше, чем с ПК и больше похожа на естественные показатели.

Для сравнения данные о распределении по устройствам для других сайтов

Даже оптовики активно используют мобильные устройства.
Даже оптовики активно используют мобильные устройства.
ПК имеют долю чуть больше половины.
ПК имеют долю чуть больше половины.

Используя данные о количестве посетителей со смартфонов можно попытаться установить реальную посещаемость сайта. По грубой оценке это будет максимум 2000 посетителей за квартал.

Так выглядит трафик с фильтром по мобильным устройствам. Гораздо больше похоже на правду.
Так выглядит трафик с фильтром по мобильным устройствам. Гораздо больше похоже на правду.

Улика четвертая. Демографические характеристики.

Также есть еще показатели, демонстрирующие, что имела место накрутка. Любопытное наблюдение, только у 2266 посетителей удалось определить пол. Нужно сказать, что здесь наблюдается характерное для отрасли преобладание женской аудитории. Но учтены только 2% всех пользователей. Остальные 98% является бесполыми, что вполне нормально для роботов.

Стоит обратить внимание на количество посетителей, без фильтра по полу их 98000.
Стоит обратить внимание на количество посетителей, без фильтра по полу их 98000.

Улика пятая. Распределение по запросам.

И в завершении один немаловажный показатель - количество переходов по запросам.

Для начала скриншот, ниже разбор.

Это не список запросов, это несбыточные мечты сеошника.
Это не список запросов, это несбыточные мечты сеошника.

1) Количество переходов по многим запросам значительно превышает в принципе поисковую аудиторию по данным вебмастера. Например, запрос «ткань микрофибра тиснение оптом» искал всего 1 человек за месяц. Здесь же мы видим аж 5502. Как им удалось скрываться от вордстата – неизвестно.

Немного статистики из вордстата. Когда явка на сайт составила 146000%.
Немного статистики из вордстата. Когда явка на сайт составила 146000%.

2) В отчете с переходами по поисковым фразам отмечено множество переходов из поисковых систем кроме яндекса. Как всем известно, поисковики скрывают информацию о поисковых запросах друг от друга. В метрике не посмотреть достоверную информацию о запросах, по которым были переходы из google,а в гугловской аналитике не видны фразы по которым были переходы из яндекса.

3) Нарушено правило Ципфа для корпуса поисковых запросов.

Суммарная частота запросов с частотой ниже 100 – 454 пользователя. Это, кстати, дает еще одну оценку реального количества посетителей. Из них 218 искали бренд, которому принадлежит сайт.

Итого, если учесть непосчитанные запросы из Гугла, всего будет порядка 400 посетителей за квартал, не считая брендовые запросы.

Итого, доля хвоста из низкочастотных запросов составляет всего 0,5%. При том, что для нормального сайта это должно быть 40-60% в зависимости от тематики.

Выводы.

Мы не судьи, чтобы выносить обвинительные заключения и уж тем более, решать, как быть с бывшим исполнителем. Возможно, здесь имело место размещение в каком-нибудь "Сервисе автоматического продвижения с гарантией результата".

Однако сама по себе ситуация крайне неприятная. Даже не затрагивая вопросы о каком-либо обмане с умыслом или без, имитация поведенческих факторов может стать причиной для жесточайших штрафных санкций со стороны поисковика. К счастью, в данном случае роботы были безобидные и не пытались имитировать действия пользователей. Да и переходы, вероятнее всего, осуществлялись не через результаты выдачи, а с подстановкой реферера. Однако, так делать нельзя.

В нашем случае, сомнения в качестве трафика у клиента появились еще до нашего появления. Мы лишь собрали доказательную базу. И главный источник подозрений - отсутствие заказов. Здесь мы видим чернейшее из чернейших SEO, которое бросает тень на всю нашу отрасль. И очень жаль, что многие заказчики становятся жертвами подобных манипуляций.

В этой статье я перечислил простые способы вычислить подлог. Но накрутка может быть куда изощреннее. Обнадеживает лишь то, что паразитам свойственно утрачивать ненужные органы. В этом случае ненужным становятся навыки работы, аналитическое мышление и ответственный подход к своему делу. А посему, мы всегда сможем вывести подобных мошенников на чистую воду.