все о заработке в интернете
инфо-бизнесе с нуля, электронной коммерции
Мой профиль Вконтакте

Дубли страниц сайта. Как от них эффективно избавиться

Добрый день, уважаемые читатели. Сегодня решил по просьбе одной из моих подписчиц написать про дубли страниц. Данная тема сегодня является одной из самых актуальных, так как наличие большого количества дублей страниц на блоге может очень сильно навредить вашему сайту. Даже если вы будете писать классные статьи, публиковать их часто, покупать ссылки на блог, но из-за большого количества одинаковых страниц все пойдет коту под хвост.

Так что откладывайте ваши дела и читайте статью до конца.

И так, дубли страниц — это разделы сайта, которые попадают в индекс поисковых систем (Яндекс, Google и т. д.), имеющие одинаковое содержание, но разные адреса.

Основная отличительная черта дубля от исходного материала в том, что ссылки дублирующей страницы выглядят не естественным образом с присутствующими на конце дополнительными знаками, цифрами или символами.

дубли страниц сайта

Разновидности дублей страниц

На сегодняшний день существует достаточно большое количество разновидностей дублей страниц, но основных, которые появляются в выдаче и причиной которых является сам движок WordPress, не так много.

Вот основные из них:

html?replytocom=1

.html#comments

.html#more-1

.html#respond

.ru/page/2

.ru/tag/

.ru/attachment/

.ru/comment-subscriptions?srp

...ru/category/

.ru/feed

И так, прямо сегодня вам необходимо отыскать и удалить те дубли страниц, которые уже присутствуют в выдаче поисковых систем.

Вообще, чтобы понять, есть ли у вас дублированный контент, зайдите на сайт seolibи проведите анализ вашего сайта. Там будет вот такая строчка:

2014.08.20-11.59.13

 

Это мои показатели. Сейчас я все уже исправил и жду, когда мой сайт будет полностью проиндексирован и все дубли буду выкинуты из поиска. На это может уйти где-то полгода.

Как искать дубли страниц

Для поиска дублей страниц в поисковых системах существуют специальные операторы. Чтобы найти одинаковые страницы, нужно в поисковой системе набрать следующие команды:

site:mysite.ru – отображает все страницы сайта попавшие в общий индекс поисковой системы. Работает как в Яндексе, так и в Google.

site:mysite.ru/& — отображает страницы сайта, которые принимают участие в основном поиске. В основном работает в Google.

site:mysite.ru replytocom – поиск дублей от комментариев.

replytocom в гугле

Вместо replytocomвы можете добавить и другие команды. Например, attachment, feedи так далее. Об этот написано выше. Обратите внимание на то, что в Google существует раздел под названием — «Скрытые результаты поиска». Он располагается в самом конце основного поиска и выглядит следующим образом:

скрытые результаты поиска в google

Вот как раз здесь то и присутствует наибольшее количество всех дублирующих страниц, которые Google держит в общем индексе, но скрывает от глаз пользователей и участия в ранжировании.

Тем не менее, иногда такие страницы могут занять даже более высокие позиции в поисковых системах. Чтобы этого не произошло, их нужно удалить!

Наиболее часто встречающимся дублем страниц является replytocom. Появляется он вследствие того, что на блоге используются древовидные комментарии.  На многих блога есть кнопка «ответить» на комментарий. В результате создается еще одна страница вот с таким адресом.

дубль replytocom

Если вы найдете такую ссылку в поисковой выдаче и перейдете по ней, то вас сразу же перекинет на сайт, где был оставлен комментарий, непосредственно к ответу комментатора.

В результате, чем больше комментариев у вас на блоге, тем больше дублирующего контента – ?replytocom.

Все остальные виды дублей вы также можете посмотреть в поисковой выдаче. Как? Я вам рассказал выше.

 Как избавиться от дублей страниц

Прежде всего, нам надо отключить в панели администратора блога позволение оставлять древовидные комментарии. Заходите в раздел настройки – обсуждение и делаете, как показано на рисунке.

2014.08.20-12.42.22

Не советую вам закрывать теги replytocomчерез robots.txt и через панель вебмастеров от Гугла. Ссылки replytocomследует закрывать специальным кодом. Поделюсь им с вами. Прежде всего вам нужно найти место, где выводится кнопка ответить. У меня ее нет на блоге, т.к. мне верстали шаблон без данной кнопки. Я уже в то время знал, что нельзя использовать древовидные комментарии. Но из-за предыдущих шаблонов они у меня остались.

Располагается код ответа на комментарий в файле functions.php. Там нужно найти вот такую строку и удалить:

<?php comment_reply_link( array_merge( $args, array( 'depth' => $depth, 'max_depth' => $args['max_depth'] ) ) ); ?>

Вместо нее нужно вставить код:

<?php printf('<span style="cursor:pointer; text-decoration: underline; color: blue;" class="comment-reply-link" onclick="return addComment.moveForm(\'comment-%s\', \'%s\', \'respond\', \'%s\')">Ответить</span>',$comment->comment_ID,$comment->comment_ID,$comment->comment_post_ID); ?>

Таким образом ваша кнопка ответить будет выводиться в виде скрипта. Т.е. новых дублей replytocom появляться не будет.

ответ в виде яваскрипта

яваскрипт код

Либо вы можете поставить плагин «wordpress-thread-comment». Он выполняет туже функцию. Но я предпочитаю избавляться от плагинов и заменять их функции кодом. Об этом я писал в серии статей.

Создать карту сайта без плагина

Редирект после первого комментария без плагина

Кнопки социальных сетей без плагина

Далее нужно избавиться от уже существующих. Для этого открываем файл htaccessи добавляем туда вот такое правило:

RewriteCond %{QUERY_STRING} ^replytocom= [NC]
RewriteRule (.*) $1? [R=301,L]

Сохраняем и закидываем на хостинг. Таким образом от большинства дублей мы избавились. Теперь остается ждать, когда пройдет полная переиндексация блога и все дубли вылетят из поиска.

На этом буду заканчивать. Если вам понравилась статья, оставляйте комментарии и поделитесь ей в социальных сетях.

С уважением, Александр Пузатых

Понравилась статья? Поделитесь с друзьями!