dubli-stranic-na-sajte

Убрать дубли страниц сайта на Joomla и WordPress. Плагины против дублей JL No Doubles и All in One Seo Pack

Плагин JL No Doubles позволяет с помощью 301 редиректа сократить количество дублирующихся материалов на вашем сайте, при этом вы сможете передать ссылочный вес от дублей к правильным страницам с точки зрения Joomla. JL No Doubles — это форк плагина Shnodoubles от Hekima, который она нам передала на поддержку. Плагин был переписан на новый API Joomla 3, а также исправлен ряд ошибок.

Как избавиться от дублей страниц Joomla

У каждой страницы материалов Joomla есть множество дублей.
Пример:
http://joomline.ru/index.php?option=com_content&view=article&id=498:den-rozhdeniya-joomline-skidki&catid=37&Itemid=199
http://joomline.ru/index.php?option=com_content&view=article&id=498
http://joomline.ru/novosti/498-den-rozhdeniya-joomline-skidki.html
http://joomline.ru/novosti/498-den-rozhdeniya-joomline-skidki
http://joomline.ru/novosti/498
В данном примере правильная страница - http://joomline.ru/novosti/498-den-rozhdeniya-joomline-skidki.html

Плагин определяет эту страницу согласно настроенным в Joomla правилам формирования ссылки, и делает редиректы со всех возможных страниц на корректную страницу. Приведенный пример — это лишь маленькая часть дублей, которые возможны в Joomla. На самом деле бывают случаи, когда от одной страницы в индекс попадает несколько десятков дублей. Со временем боты поисковых систем, обходя сайт, склеивают страницы согласно правилам редиректов. Таким образом, количество дубли страниц Joomla могут уменьшится в несколько раз.

Особенности плагина JL No Doubles:

  • Полная поддержка Joomla 3 и Joomla 2.5
  • Локализация: русский и английский
  • Работа с com_content и с меню Joomla
  • Настройка 301 редиректа на корректную страниц
  • Возможно настроить 404 ошибку при попадании на не корректную страницу
  • Так же есть возможность задать исключения для абсолютно любого компонента установленного на сайте

Настройки очень простые:

plagin_jl_no_doubles

Особенности плагина JL No Doubles

Плагин распространяется бесплатно.
Официальная страница плагина: JL No Doubles.

Скачать плагин у нас:

Скачать JL No Doubles (222 downloads)

 

Как избавиться от дублей страниц WordPress

Простой способ убрать дубли страниц

Если вы давно занимаетесь техническим совершенствованием своего блога, то наверняка уже сделали самые простые шаги, предотвращающие появление дублей. Проверьте себя:

  1. Убедитесь, что у вас настроен редирект с www на без www (или наоборот). Проверить это можно, набрав в адресной строке браузера адрес сайта: www.pro-wordpress.ru. Он должен автоматически замениться на pro-wordpress.ru. Если у вашего сайта несколько доменов, аналогично со всех них должен стоять редирект на главное зеркало сайта.
  2. В настройках плагина «All in One SEO Pack» должны стоять галочки «Канонические URL'ы (Canonical URLs)».
  3. Многое зависит от настроек файла robots.txt. Если у вас нет понимания, для чего он нужен, обязательно прочитайте статью по ссылке.

Хорошо, если у вас сделаны эти три простейших пункта, но это еще не значит, что вы знаете, как удалить дубли страниц. Все самое интересное впереди.

Что такое дубли страниц WordPress replytocom и другие?

Если ваш блог сделан на WordPress, у вас наверняка присутствуют следующие типы дублей страниц:

  • replytocom
  • feed
  • tag
  • page
  • comment-page
  • attachment
  • attachment_id
  • category
  • trackback

Например, если добавить в конце урла любой статьи /feed, откроется xml версия статьи для RSS-рассылки - ее текст тот же самый, но адрес отличается. Replytocom используется в древовидных комментариях при нажатии кнопки «Ответить». Выходит, что каждый комментарий создает дополнительный url одной и той же страницы. А если у статьи тысяча комментариев, то и дублей у нее будет 1000.

Полностью замените содержимое своего файла robots.txt на новое:

User-agent: *
Host: ВАШ САЙТ
Disallow: /wp-feed
Disallow: /wp-includes
Disallow: /wp-content/cache
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Sitemap: https://ВАШ САЙТ/sitemap.xml
User-agent: YandexImages
Allow: /wp-content/uploads/
User-agent: Googlebot-Image
Allow: /wp-content/uploads/

Поменяйте ВАШ САЙТ на свой адрес. Теперь роботу разрешено заходить на любые страницы сайта.

Найдите файл .htaccess в корне сайта. Добавьте в него следующий код после строки RewriteRule ^index\.php$ — [L]:

RewriteCond %{QUERY_STRING} ^replytocom= [NC]
RewriteRule (.*) $1? [R=301,L]
RewriteRule (.+)/feed /$1 [R=301,L]
RewriteRule (.+)/attachment /$1 [R=301,L]
RewriteRule (.+)/comment-page /$1 [R=301,L]
RewriteRule (.+)/comments /$1 [R=301,L]
RewriteRule (.+)/trackback /$1 [R=301,L]
RewriteCond %{QUERY_STRING} ^attachment_id= [NC]
RewriteRule (.*) $1? [R=301,L]

Это набор 301-редиректов. Теперь при попытке робота зайти на страницы типа ВАШ САЙТ/post-name/feed/ его перебросит на оригинальную страницу типа ВАШ САЙТ/post-name/.

В активной теме блога найдите файл function.php и добавьте в него код после <?php:

/* Вставляет мета-тег роботс noindex,nofollow постраничного разбиения */
function my_meta_noindex () {
if (
is_paged() // Все и любые страницы пагинации
) {echo "".'<meta name="robots" content="noindex,nofollow" />'."\n";}
}
add_action('wp_head', 'my_meta_noindex', 3); // добавляем свой noindex,nofollow в head

Теперь на страницах c постраничным разбиением записей (например, http://pro-wordpress.ru/page/2) поисковик наткнется на запрещающий индексацию мета-тег и не будет показывать страницу в выдаче. Этот пункт я ставлю под сомнение, т.к. многие оптимизаторы считают, что нельзя закрывать от индексации страницы с анонсами статей блога. Выполнять данный пункт или нет, решайте сами.

Перейдите в параметры плагина All in One Seo Pack и выставите следующие настройки индексации (см. скриншот)
Настройка All in One SEO Pack

Этими настройками плагин All in One Seo Pack автоматически добавил мета-тег «robots» на страницы с тегами и рубриками. Не пришлось делать это вручную, как для страниц с пагинацией записей.

В админ-панели WordPress переходим в «Настройки -> Обсуждение» и снимаем галку с «Разбивать комментарии верхнего уровня на страницы»: Это нужно для того, чтобы комментарии не делились постранично. Тогда и не появятся новые адреса для тех же страниц.

Источник, Второй источник

Вот и все, если Вы хотите «поблагодарить» наше IT сообщество — у вас есть такая возможность: справа есть варианты для пожертвований на развитие портала. Или поделитесь статьей в ваших соц.сетях через сервис ниже.

Отправить ответ

Please Login to comment
Войти с помощью: 
  Subscribe  
Notify of
Authorization
*
*
Войти с помощью: 
Registration
*
*
*
Войти с помощью: 

two × 4 =

Password generation