1655 подписчиков

Убрали дубли страниц — трафик вырос вдвое. Рассказываю как

3 дня назад3 дня назад

10 мин

Этот кейс я вспоминаю каждый раз, когда мне говорят, что SEO — это «магия» и «никто не понимает, как оно работает». Иногда всё гораздо проще и честнее: сайт сам себе мешал расти, мы убрали помеху — и он пошёл вверх. Без закупки ссылок, без переписывания контента, без накрутки. Одна техническая чистка. Органика выросла ровно вдвое за три месяца, и держится до сих пор. Расскажу по порядку, что это были за дубли, как я их искал, чем убирал и почему именно из-за них Яндекс держал сайт в тени. Постараюсь так, чтобы вы смогли проверить свой проект сами — хотя бы на уровне «есть проблема или нет». Сайт, который душил сам себя Пришёл ко мне интернет-магазин товаров для дома — около 4 000 страниц в индексе, ниша конкурентная, но не адская. Хозяин жаловался на классику: «Полгода вкладываем в контент и ссылки, а позиции стоят. По части запросов вообще проседаем, хотя ничего не трогали». Первое, что я сделал, — не побежал писать тексты и закупать ссылки. Я открыл Яндекс Вебмастер и посмотрел, скол

Расскажу по порядку, что это были за дубли, как я их искал, чем убирал и почему именно из-за них Яндекс держал сайт в тени. Постараюсь так, чтобы вы смогли проверить свой проект сами — хотя бы на уровне «есть проблема или нет».

Сайт, который душил сам себя

Пришёл ко мне интернет-магазин товаров для дома — около 4 000 страниц в индексе, ниша конкурентная, но не адская. Хозяин жаловался на классику: «Полгода вкладываем в контент и ссылки, а позиции стоят. По части запросов вообще проседаем, хотя ничего не трогали».

Первое, что я сделал, — не побежал писать тексты и закупать ссылки. Я открыл Яндекс Вебмастер и посмотрел, сколько страниц в индексе и сколько из них реально приносят трафик. Картина была показательная: в поиске болталось почти 11 000 страниц вместо ожидаемых 4 000. Откуда лишние семь тысяч? Дубли. Сайт сам наплодил себе клонов и заставил Яндекс тратить на них ресурсы.

Когда поисковик видит десяток почти одинаковых страниц, он не может понять, какую из них показывать в выдаче. Он начинает «думать», тасует их между собой, иногда показывает не ту, иногда не показывает вообще. Плюс размывается ссылочный вес: вместо одной сильной страницы у вас пять слабых полукопий. Результат — позиции скачут, трафик не растёт, бюджет на продвижение уходит в песок.

Что такое дубли и почему Яндекс из-за них режет трафик

Дубль — это когда один и тот же (или почти один и тот же) контент доступен по разным адресам. Для человека это одна страница. Для поисковика — несколько разных URL с одинаковым содержимым.

Поисковая система не любит дубли по трём причинам сразу. Первая — каннибализация: страницы конкурируют друг с другом за один запрос, и ни одна не выходит в топ. Вторая — растрата краулингового бюджета: робот тратит лимит обхода на бессмысленные копии вместо новых и важных страниц. На крупном сайте это значит, что часть полезных страниц робот просто не успевает переобойти, и они устаревают в выдаче. Третья — снижение доверия: сайт, забитый техническим мусором, выглядит для алгоритма неаккуратным, а Яндекс в последние годы очень чувствителен к «качеству» ресурса в целом.

Если копнуть глубже в технические факторы ранжирования, дубли — это та самая базовая гигиена, без которой не работает ни контент, ни ссылки. Я об этом регулярно пишу в тематических статьях блога: можно сколько угодно вылизывать тексты, но если фундамент дырявый, трафик будет утекать быстрее, чем вы его наливаете.

Откуда берутся дубли (и почему вы их не видите глазами)

Главная подлость дублей в том, что на сайте их не видно. Вы ходите по страницам, всё открывается нормально, контент уникальный. А поисковик при этом индексирует десятки технических версий каждой страницы. Вот самые частые источники, которые я нахожу почти в каждом проекте.

Слеш на конце адреса. site.ru/catalog и site.ru/catalog/ для Яндекса — это два разных URL. Если оба отдают 200-й код и одинаковый контент — поздравляю, у вас дубль на каждой странице сайта.

www и без www, http и https. Классика, которую до сих пор ловлю на старых проектах. Сайт открывается по четырём вариантам адреса сразу, и каждый из них поисковик считает отдельным.

UTM-метки и параметры. Любая ссылка из рассылки или рекламы с хвостом ?utm_source=... создаёт технический дубль. То же — параметры сортировки и фильтров в каталоге: ?sort=price, ?color=red, ?page=2. На магазине это сотни и тысячи мусорных URL.

Пагинация. Страницы /catalog/?page=2, /page/3/ часто индексируются как самостоятельные, хотя по сути это куски одного листинга.

Версии для печати, AMP, replytocom в WordPress, страницы вложений (attachment), фид-страницы. WordPress, кстати, любитель плодить дубли по умолчанию — особенно страницы прикреплённых картинок и комментарии с параметром ?replytocom.

Главная по двум адресам. site.ru и site.ru/index.php (или /home/) — тоже частый и обидный дубль самой важной страницы.

В том магазине у меня сработали почти все пункты из списка: и слеши, и параметры фильтров, и пагинация, и WordPress-мусор. Семь тысяч лишних страниц сложились именно из этого.

Как я искал дубли: инструменты и порядок действий

Тут нет магии, есть методичность. Я всегда иду одним и тем же маршрутом.

Начинаю с Яндекс Вебмастера. Раздел «Индексирование» → «Страницы в поиске» и «Статистика обхода». Сразу видно расхождение между количеством страниц на сайте и в индексе. Если в индексе кратно больше — дубли почти гарантированы. Там же в разделе с исключёнными страницами Яндекс прямо подсказывает: «Дубль», «Малоценная или малополезная страница» — это ваш список на чистку.

Дальше — оператор site: в самом Яндексе. Вбиваю site:домен.ru и листаю выдачу. Глаз быстро цепляет одинаковые заголовки и сниппеты у разных URL — это и есть дубли. Можно сузить: site:домен.ru inurl:? покажет страницы с параметрами, site:домен.ru replytocom выловит вордпрессовский мусор.

Потом — краулер. Я использую Screaming Frog (для небольших сайтов хватает бесплатной версии). Он обходит сайт как робот и показывает все URL, дублирующиеся Title, Description и H1. Совпадающие метатеги — почти всегда маркер дубля. Заодно вижу цепочки редиректов и битые ссылки.

И обязательно — логи сервера. По логам видно, на что реально робот тратит обходы. Когда выяснилось, что робот того магазина половину визитов тратил на страницы фильтров с параметрами, стало понятно, почему новые карточки товаров индексировались по две недели. Если хотите системно разобрать техническую сторону, это как раз задача технической доработки сайта — там логи, краулинговый бюджет и сервер идут одним блоком.

Как убирал: canonical, 301, Clean-param и robots — что куда

Самая частая ошибка новичков — закрыть всё подряд в robots.txt и думать, что проблема решена. Нет. Для разных типов дублей нужны разные инструменты, и важно не перепутать.

301-й редирект — для дублей, которые надо склеить намертво. Слеш/без слеша, www/без www, http/https, главная по двум адресам — всё это решается настройкой постоянного редиректа на одну каноническую версию. Поисковик переносит вес со старого адреса на новый и забывает про дубль. Это самый «жёсткий» и надёжный способ.

Атрибут rel="canonical" — для случаев, когда обе страницы должны быть доступны людям, но в индексе нужна одна. Классика — карточка товара, доступная из разных категорий, или пагинация. На странице-копии прописываем canonical на основную, и Яндекс понимает, какую считать главной.

Директива Clean-param в robots.txt — это родная фишка Яндекса, которую почему-то почти никто не использует. Она говорит роботу: «вот эти параметры (utm, sort, sessionid и т.д.) на ранжирование не влияют — склей такие URL с чистым адресом». Для магазина с фильтрами и метками это спасение: одна директива убирает тысячи параметрических дублей без единого редиректа.

robots.txt и noindex — для служебных страниц, которым в индексе вообще не место (корзина, личный кабинет, результаты внутреннего поиска, страницы печати). Тут важно понимать разницу: robots.txt закрывает обход, meta noindex закрывает индексацию. Иногда нужно второе, а не первое, и путаница здесь стоит позиций.

В том проекте я сделал так: склеил зеркала и слеши через 301, закрыл параметры фильтров и UTM через Clean-param, проставил canonical на пагинации и кросс-категорийных карточках, убрал в noindex вордпрессовский мусор и страницы вложений. Потом отправил на переобход ключевые разделы через Вебмастер и стал ждать. Дубли уходят из индекса не мгновенно — Яндексу нужно время переобойти и переварить изменения.

Что произошло с трафиком за три месяца

Первые две-три недели не менялось почти ничего — это нормально, не пугайтесь. Затем количество страниц в индексе поползло вниз: с 11 000 к 4 200, то есть к реальному размеру сайта. Параллельно начали подрастать позиции по коммерческим запросам — те самые карточки и категории, которые раньше конкурировали с собственными копиями, наконец перестали «толкаться локтями».

К концу третьего месяца органический трафик из Яндекса вырос ровно вдвое относительно точки старта. Заявок стало больше пропорционально — а это, в отличие от позиций, то, ради чего всё и затевалось. И что важно: эффект устойчивый, потому что мы не накручивали и не обманывали алгоритм, а убрали реальную техническую проблему. Такие результаты не откатываются после очередного апдейта. Похожие истории по другим нишам я собрал в портфолио кейсов — механика везде разная, но логика одна: сначала убрать то, что мешает, потом наращивать.

Частые ошибки, из-за которых дубли возвращаются

Чистка дублей — это не разовая акция, а гигиена. Вот на чём чаще всего спотыкаются, и из-за чего дубли отрастают заново.

Закрыли дубль в robots.txt, но не убрали canonical/редирект. Робот не может зайти на страницу, чтобы увидеть указание склеить её, — и она зависает в индексе как «обнаружена, но не проиндексирована». Получается ни туда ни сюда.

Поставили canonical сами на себя по всему сайту через плагин и забыли. Сталкивался с ситуацией, когда canonical вёл на главную со всех страниц — сайт фактически вычеркнул себя из выдачи целиком. Любую автоматизацию надо проверять руками.

Не настроили правила для новых страниц. Магазин добавляет фильтры, CMS генерирует новые параметрические URL — а правило их обработки никто не прописал. Через полгода дубли возвращаются. Поэтому решение должно быть на уровне шаблона и сервера, а не точечной правки.

Перепутали 301 и 302. Временный редирект (302) вес не передаёт. Для склейки зеркал нужен именно постоянный, 301-й.

Если самостоятельно лезть в это страшно — а с серверной частью и правда легко наломать дров — имеет смысл сначала заказать бесплатный аудит сайта. Я посмотрю индекс, логи и структуру URL и скажу прямо, есть у вас проблема дублей или трафик стоит по другой причине. Без этого браться за правки вслепую — лотерея.

Как понять, что дубли есть у вас прямо сейчас

Сделайте три быстрые проверки, не вставая со стула.

Откройте свой сайт по адресу со слешем и без слеша на конце, с www и без, по http и https. Если все варианты открываются и не редиректят на один — у вас уже есть дубли зеркал.

Вбейте в Яндексе site:вашдомен.ru и пролистайте. Видите одинаковые заголовки у разных адресов, кучу страниц с ? в URL, технические разделы — это сигнал.

Зайдите в Яндекс Вебмастер и сравните число страниц на сайте с числом в индексе. Расхождение в разы — почти приговор.

Если хотя бы одна проверка показала проблему — её стоит решать в первую очередь, до любого контента и ссылок. Я разбираю такие вещи и на персональной SEO-консультации: можно прийти со своим проектом, и за пару часов мы наметим конкретный план, что и в каком порядке чистить. Кто я и как работаю — коротко на странице об авторе, если хотите познакомиться перед стартом.

Если устали смотреть, как трафик утекает в дубли

Этот кейс — про то, что часто проблема не в рынке и не в бюджете, а в технических мелочах, которые годами тихо съедают вашу видимость. Дубли — самая частая из них, но далеко не единственная.

Я работаю в SEO с 2003 года, веду проекты лично, без агентских прослоек, и беру по одному клиенту в нише — чтобы не разрываться и не продвигать ваших же конкурентов. За плечами 300+ проектов и ноль фильтров Яндекса за всё время: я не накручиваю, а убираю реальные причины, по которым сайт не растёт. Если вы устали платить за продвижение и не видеть результата — давайте я наведу порядок в технике и заберу для вас тот трафик, который сейчас утекает в дубли и мусорные URL. Начать можно с бесплатного аудита — посмотрю ваш сайт и честно скажу, что мешает и сколько займёт исправление. Заказать SEO-продвижение и раскрутку сайта или просто обсудить задачу можно через форму обратной связи.

И отдельно — то, что даёт фору именно сейчас. Я подключаю GEO-продвижение (Generative Engine Optimization) — оптимизацию под ответы нейросетей: Яндекс Нейро, Алису, YandexGPT, GigaChat, ChatGPT и Perplexity. Пока поиск всё активнее отвечает прямо в нейросети, выигрывает тот, чей сайт ИИ цитирует как источник. Чистая техника (включая те самые дубли, из-за которых нейросеть может «зацепить» не ту версию страницы) — это фундамент и для GEO тоже. Связка «классическое SEO + GEO» работает на опережение: вы попадаете и в обычную выдачу, и в ответы ИИ, пока конкуренты разбираются, что это вообще такое. Хотите подключить — напишите мне, разберём ваш проект и составим план.

Лучшее время убрать дубли и зайти в нейровыдачу было год назад. Второе по лучшести — сегодня.

#дублистраниц #SEO #SEO2026 #техническоеSEO #дублиURL #canonical #cleanparam #краулинговыйбюджет #ЯндексВебмастер #301редирект #SEOпродвижение #продвижениесайтов

Маркетинг и продажи

129,1 тыс интересуются