Как избавиться от дубликатов страниц сайта на Joomla

Дубликаты страниц усложняют структуру сайта и мешают его качественному ранжированию в поисковых системах. Чтобы найти и удалить дубли готовых страниц в Joomla, можно использовать один из способов в этой статье.

Применение мета-тега «Robots»

Самый простой способ запретить индексировать страницу-дубликат - это выставить мета тег с атрибутом name="robots". Это специальный тег, с помощью которого можно приказать роботу индексировать или не индексировать текущую страницу:
<meta name=”robots” content=”noindex”>
Чтобы установить этот тег на страницу записи, перейдите в панель администрирования, на страницу редактирования нужной записи. Кликните на закладку "Параметры публикации": Параметры публикации в Joomla Найдите на странице пункт "Метатег Robots" и поставьте его в значение noindex, nofollow: Параметры публикации в Joomla noindex запрещает поисковым системам добавлять страницу в результаты выдачи. А nofollow ещё и запрещает переходить по ссылкам, которые есть на странице.

Запрет в файле «Robots.txt»

Второй способ не менее надёжный - запрет индексации в файле robots.txt. Этот файл специально сделан для поисковых роботов. В нём содержатся правила индексации сайта. Каждый день поисковые роботы считывают этот файл и корректируют свою поисковую выдачу.

Попробуем добавить в этот файл запрет на индексирование страницы сайт.ру/папка/страница.html. Откройте файл "robots.txt", который находится в корневой папке сайта, и добавить в самый конец такую строчку:
Disallow: /папка/страница.html
Директива "Disallow" (перевод с английского "запрещено") запрещает индексирование страницы поисковыми роботами. Обратите внимание, что был использован именно относительный путь к файлу, индексацию которого мы хотим запретить.

У этой директивы есть одна особенность. Она будет запрещать индексирование страниц, у которых в адресе есть запрещённое выражение. Таким образом можно запрещать целые папки. К примеру, после сохранения нашего пример будет запрещена не только индексация файла /папка/страница.html, но и страниц с параметрами от неё /папка/страница.html?param=1.

Аналогично и с папками. Если написать такой запрет:
Disallow: /папка/
То будут запрещены к индексации все страницы, у которых в начале пути стоит "/папка/". Будут запрещены:
/папка/страница.html
/папка/подпапка/страница.html
/папка/кулинария/еда.html
/папка/сыр/молоко.html
MouseDC.ru - хостинг, виртуальный хостинг, покупка доменов, проверка доменов, WHOIS, курсы создания сайтов, вебинары по созданию, курсы разработки сайтов, доработка сайтов, сопровождение сайтов, разработка сайтов, техподдержка сайтов
Была ли эта статья полезна? Есть вопрос?
Cмотрите другие статьи: