Как избавиться от дубликатов страниц сайта на Joomla

Дубликаты страниц усложняют структуру сайта и мешают его качественному ранжированию в поисковых системах. Чтобы найти и удалить дубли готовых страниц в Joomla, можно использовать один из способов в этой статье.

Применение мета-тега «Robots»

Самый простой способ запретить индексировать страницу-дубликат - это выставить мета тег с атрибутом name="robots". Это специальный тег, с помощью которого можно приказать роботу индексировать или не индексировать текущую страницу:
<meta name=”robots” content=”noindex”>
Чтобы установить этот тег на страницу записи, перейдите в панель администрирования, на страницу редактирования нужной записи. Кликните на закладку "Параметры публикации": Параметры публикации в Joomla Найдите на странице пункт "Метатег Robots" и поставьте его в значение noindex, nofollow: Параметры публикации в Joomla noindex запрещает поисковым системам добавлять страницу в результаты выдачи. А nofollow ещё и запрещает переходить по ссылкам, которые есть на странице.

Запрет в файле «Robots.txt»

Второй способ не менее надёжный - запрет индексации в файле robots.txt. Этот файл специально сделан для поисковых роботов. В нём содержатся правила индексации сайта. Каждый день поисковые роботы считывают этот файл и корректируют свою поисковую выдачу.

Попробуем добавить в этот файл запрет на индексирование страницы сайт.ру/папка/страница.html. Откройте файл "robots.txt", который находится в корневой папке сайта, и добавить в самый конец такую строчку:
Disallow: /папка/страница.html
Директива "Disallow" (перевод с английского "запрещено") запрещает индексирование страницы поисковыми роботами. Обратите внимание, что был использован именно относительный путь к файлу, индексацию которого мы хотим запретить.

У этой директивы есть одна особенность. Она будет запрещать индексирование страниц, у которых в адресе есть запрещённое выражение. Таким образом можно запрещать целые папки. К примеру, после сохранения нашего пример будет запрещена не только индексация файла /папка/страница.html, но и страниц с параметрами от неё /папка/страница.html?param=1.

Аналогично и с папками. Если написать такой запрет:
Disallow: /папка/
То будут запрещены к индексации все страницы, у которых в начале пути стоит "/папка/". Будут запрещены:
/папка/страница.html
/папка/подпапка/страница.html
/папка/кулинария/еда.html
/папка/сыр/молоко.html
MouseDC.ru - хостинг, виртуальный хостинг, покупка доменов, проверка доменов, WHOIS, курсы создания сайтов, вебинары по созданию, курсы разработки сайтов, доработка сайтов, сопровождение сайтов, разработка сайтов, техподдержка сайтов
Cмотрите другие статьи:
Была ли статья полезной?
Была ли эта статья полезна? Есть вопрос?
хостинг для сайтов
Закажите недорогой хостинг Заказать

всего от 290 руб