Атрибут rel=“canonical”: что это и чем он полезен в SEO
В статье мы подробно рассказываем про конструкцию <link rel="canonical" href=""/>: что это, зачем и когда используется, а также как правильно настроить тег и атрибуты, чтобы улучшить SEO-показатели.
Атрибутом (attribute) называется компонент в языке гипертекстовой разметки (HTML), который приписывает дополнительное свойство HTML-элементу. Соответственно, rel="canonical" — это атрибут «rel» со значением «canonical» (канонический), т. е. указание, что у данной страницы есть другая, предпочтительная версия. Информация о наличии основной веб-страницы нужна поисковикам: так решается проблема дублирования контента, когда на сайте есть несколько URL-адресов, ведущих на одно и то же или очень похожее содержание. Атрибут rel="canonical" сообщает поисковым роботам, какую страницу следует рассматривать как оригинальную.
Изображение от pch.vector на Freepik.Итак, rel — это сам атрибут, canonical — значение, которое придает статус «каноничности» описываемому элементу. Но что это за элемент и как поисковик понимает, где искать предпочтительную веб-страницу? Давайте немного углубимся в синтаксис HTML.
Атрибуты не используются сами по себе, поскольку они описывают лишь признак. Объектом выступает открывающий тег элемента. В нашем случае это тег <link>, добавляющий в HTML-документ ссылку. Она нужна, чтобы поисковая система увидела адрес, где расположен такой же контент, что и на сканируемой странице. Для этого, помимо rel="canonical", необходимо добавить в tag link атрибут href, содержащий в своем значении необходимый URL.
В результате конструкция должна выглядеть следующим образом:
<link rel="canonical" href="URL-адрес-канонической-страницы"/>
Если на вашем сайте имеется несколько похожих или одинаковых веб-страниц с разными URL-адресами, определить среди них каноническую и сообщить об этом роботам Google или Яндекса может быть важно по нескольким причинам:
Несмотря на всю пользу, строка <link rel="canonical" href=""/> является для краулеров лишь рекомендацией, а не приказом к действию. То есть даже если вы укажите canonicals для всех дублей, система может проигнорировать это и выдать в поиске неканонический URL-адрес. Такое происходит, когда поисковик считает данную страницу более подходящей, релевантной запросу пользователя. Помимо атрибута «рел» он учитывает и другие канонические сигналы, поэтому в индексе нередко оказываются страницы, на которых прописаны links с канониклами.
«Канонический элемент», как еще называют link с атрибутами rel="canonical" и href, играет значительную роль в оптимизации сайта для поисковых систем, потому что его использование позволяет избегать санкций за неуникальность и даже дублирование контента — разумеется, в пределах одного веб-ресурса. С помощью канониклов вы сообщаете поисковикам, какую страницу, по вашему мнению, стоит ранжировать выше других, и таким образом способствуете лучшему продвижению своего контента. К тому же, если система не получит подсказки в виде link + rel + href, то может определить каноническую веб-страницу автоматически — вполне вероятно, что неправильно, и тогда из индекса выпадет настоящий каноникал.
Изображение от vectorjuice на Freepik.Мы расскажем о нескольких способах настройки атрибута rel="canonical". В первых двух действует один принцип: код размещается на страницах-дублях, поэтому редактировать канонические документы нет необходимости. Указать тег link с rel и href можно также через XML-файлы карты сайта или посредством плагинов в системах управления контентом. Разберем каждый метод отдельно
Самый простой — хоть и не быстрый, если на вашем проекте много страниц с похожим контентом — способ настроить rel="canonical" — это вручную вставить в HTML-код страниц-дублей упомянутую выше конструкцию:
<link rel="canonical" href="https://site.com/canonical-page"/>
Где https://site.com/canonical-page — абсолютный путь до вашей канонической страницы. В значении атрибута href нужно обязательно прописывать URL-адрес вместе с HTTP-протоколом, причем предпочтительно указывать именно защищенный вариант с HTTPS. Весь элемент помещается в содержание блока <head></head>, ближе к началу, чтобы робот мог увидеть его до загрузки скриптов JavaScript.
Не все документы на веб-сайте имеют формат HTML. Например, у PDF- или DOCX-файлов нет head-тегов, поэтому предыдущий способ не подойдет для добавления канониклов на подобные страницы. В этом случае сообщить поисковику канонический адрес можно через аннотацию link в HTTP-заголовке. Вам понадобится доступ к настройкам сервера.
В заголовках HTTP файлов-дублей поместите следующую строку:
Link: http://site.com/canonical-file.pdf; rel="canonical"
Где в качестве ссылки укажите путь до файла предпочтительного формата.
Строго говоря, здесь атрибуты rel и href используются редко и в основном для указания на альтернативные языковые версии страниц, однако как метод сообщения канонических адресов поисковым системам XML-карта сайта тоже вполне пригодна. Дело в том, что Google изначально считает все ссылки, данные в файле sitemap.xml, оригинальными. Вам достаточно самим выбрать канонические страницы, прописать их URL-адреса (с HTTPS!) в тегах <loc></loc>, и поисковик самостоятельно определит, какие из документов дублируют контент, а какие являются основными.
Если ваш веб-сайт работает на CMS-движке вроде WordPress, Joomla, Drupal и других, то для настройки link с атрибутами rel="canonical" и href можно использовать его функционал. Большинство популярных систем управления контентом предоставляют плагины, которые позволяют быстро указать канонические страницы практически без ручного вмешательства. Например, в ВордПрессе с этим справится Yoast SEO.
В основе всех ситуаций, когда требуется использование <link rel="canonical" href=""/>, лежит проблема повторяемости контента. Но не всегда содержание страниц буквально дублируется: бывает, что один веб-документ обслуживается разными URL-адресами. Например, лендинг, на который ведут несколько ссылок из различных рекламных каналов. Фактически это не дубли — и все же поисковая система сочтет их отдельными веб-страницами из-за отличий в адресе. Работа с каноническим атрибутом позволяет избежать подобного развития событий. Ниже расскажем, при каких условиях стоит настраивать link, rel и href.
Во-первых, конечно, канониклы необходимо указывать для веб-страниц с идентичным или очень похожим наполнением: вроде карточек одного и того же товара разных цветов или входящего в несколько категорий каталога одновременно. Если вы точно знаете о наличии дублей на вашем сайте, обязательно добавьте на них канонические ссылки, чтобы избежать индексации неуникального контента и передать весь «авторитет» оригинальной странице. Найти дубликаты можно с помощью сервисов Яндекс.Вебмастер и Google Search Console (GSC), а также посредством сторонних онлайн-инструментов типа Топвизора или Sreaming Frog SEO Spider.
Когда на веб-сайте присутствуют длинные списки товаров, статей, изображений или другого контента, то обычно их дробят на отдельные веб-страницы и нумеруют, чтобы ускорить загрузку и упростить восприятие информации для пользователя. Этот процесс называется пагинацией. Индексировать все страницы пагинации не всегда выгодно: например, их содержание может повторяться из-за разных настроек фильтрации, что плохо сказывается на авторитете ресурса в поисковых системах. В данном случае канонический элемент поможет сфокусировать внимание ботов на главной странице списка. Как правило, в качестве канонической устанавливают веб-страницу «Show all» либо просто первую в категории. То есть на всех страницах пагинации, начиная со второй, указывают ссылку следующего вида:
<link rel="canonical" href="https://site.com/catalog/category"/>
Если ваш сайт доступен по разным протоколам (HTTP и HTTPS), а также с и без префикса «www», рекомендуется использовать канонические ссылки для указания основной версии. Несмотря на то, что все четыре ссылки (HTTP с/без www и HTTPS с/без www) фактически ведут на один и тот же веб-сайт, с точки зрения поисковиков это отдельные адреса. Во избежание образования дублей следует прописать канониклы (или настроить редирект). Например, вы можете установить каноническую ссылку для HTTPS-версии сайта, тем самым указав, что она является предпочтительной. Это снизит вероятность индексации HTTP-версии и снижения позиций в результатах поиска.
Google давно ставит в приоритет веб-проекты, имеющие мобильную версию или адаптивный дизайн: бОльшая часть интернет-трафика идет с гаджетов. Но если с «адаптивом» проблем нет, то наличие отдельного URL-адреса для пользователей мобильных устройств (обычно это m.site.com) может сыграть с сайтом злую шутку, если не настроить каноникал. Поисковики могут счесть мобильную и десктопную версию дублями, поэтому обязательно пропишите в коде первой каноническую ссылку на вторую:
<link rel="canonical" href="https://site.com"/>
А в десктопной укажите альтернативную ссылку на мобильную:
<link rel="alternate" href="https://m.site.com"/>
Речь идет об URL-адресах с дополнительными параметрами, такими как UTM-метки, которые используются маркетологами для отслеживания рекламного трафика. Динамические адреса автоматически генерируются CMS, когда пользователь сортирует товары в каталоге, применяет фильтры и т. п. Они выглядят примерно так: https://site.com/smartphone/brand=apple&color=black. Комбинаций параметров может быть очень много, поэтому лучше определить для всех адресов одной категории каноническую страницу.
Изображение от storyset на Freepik.Для проверки настройки атрибута можно воспользоваться официальными панелями для веб-мастеров, которые мы упоминали выше. Чтобы узнать, какие страницы считает каноническими Google, откройте GSC и введите URL в адресную строку вверху интерфейса. Если нужно проверить мнение Яндекса, перейдите во вкладку «Индексирование» в Вебмастере. Далее — пункт «Страницы в поиске». Обнаруженные дубли будут помещены в раздел «Исключенные страницы».
Запрет индексирования в robots.txt. Если каноническая страница запрещена для сканирования роботом, то в индекс попадет дубль. Если запрещены неканонические — бот не увидит каноникал.
Указание нескольких канониклов для одной страницы. Поисковик либо выберет только первую ссылку, либо вообще проигнорирует тег.
Создание канонических цепочек. На странице, которая считается основной, не должно быть указания на другой каноникал.
Другой домен в каноническом адресе. Ссылка должна указывать на тот же сайт, где размещена неканоническая страница.
Атрибут rel="canonical" нужен для решения проблемы дублирования контента и улучшения индексирования сайта поисковыми системами. Его эффективность зависит от правильной настройки, что требует внимания к деталям и понимания структуры вашего веб-ресурса. Надеемся, наша статья была для вас полезна.
Автор: ЕвробайтПоделиться
Когда нужно быстро создать привлекательный сайт, в качестве платформы для него выбирают конструктор или CMS. Оба решения позволяют легко найти веб-мастера, как для создания веб-ресурса, так и для дальнейшей его доработки при развитии проекта.
Компании заинтересованы в оптимизации рутинных и объемных задач, отнимающих у сотрудников большое количество времени. Поэтому крупные компании начали активно заниматься машинным обучением, а другие следить за их успехами и внедрять готовые продукты в свой бизнес.
Бизнес бывает разным, и у каждого есть особые «боли», которые нужно закрыть при формировании ИТ-инфраструктуры. Облачный сервис может удовлетворить потребности разных компаний.
On our site you can pay
for services with cryptocurrency
Надёжные VPS серверы с посуточной оплатой в России и Европе.
От 10 ₽ в день!
Арендовать виртуальный сервер