Прежде, чем начинать избегать дублирования контента, желательно выяснить, что же это такое. Почему это явление столь нежелательно, что с ним невозможно примириться. О наличии дублированного контента можно говорить, если пользователь, переходя по разным ссылкам, видит одинаковый материал.
Чтобы понимание стало более полным, на ситуацию советуется взглянуть с точки зрения поисковиков. От их мнения зависит позиция сайта в выдаче и вообще его благополучие. Поисковые роботы, индексирующие дублированный контент, могут быть несколько дезориентированы. Ведь поисковые системы ориентированы на максимальное удовлетворение поисковых запросов.
Как поисковик может определить релевантность страниц, дублирующих друг друга? В поисковой выдаче не отражаются все обнаруженные копии. Возникает вопрос: какие отражаются, какие ранжируются, какие будут признаны самыми авторитетными?
Особенности отбора
Все зависит от решения поисковика, а значит, дублирование контента может посодействовать пессимизации сайта. Появиться дублированный контент может даже без ведома хозяина – кто-то скопипастил статью, например. А может быть, вполне официально создана версия для печати.
Индексирующий такие страницы поисковый робот посчитает это дублированием контента. Появиться на сайте дублированный контент способен также в результате не совсем правильной внутренней оптимизации.
Или взять, к примеру, сайт интернет магазина. Здесь обычно очень много страниц, много разной информации о товарах. Список товаров может сортироваться по разным параметрам – по алфавиту или по цене. Соответственно генерируются уникальные ссылки, ведущие на различные, но очень похожие, почти одинаковые страницы. Для робота-поисковика это, опять-таки, дублирование контента. Как видим, без него не обойтись ни одному сайту.
Что делать?
Обнаружив на своём ресурсе дублированный контент, нужно предпринимать срочные действия, чтобы его как-то обезвредить. Иначе негативные последствия неизбежны, от понижения в выдаче до полного удаления из каталогов. Идеальным выходом была бы полная чистка текстов. Но провести её не всегда возможно. Некоторые тексты просто нельзя удалять со страниц ресурса, с другими не удаётся провести такую операцию.