Содержание статьи

Атрибут rel=”canonical” – инструмент для решения проблемы дублирования контента. WEDEX делится тем, как можно использовать атрибут и какие распространенные ошибки могут произойти.
Что такое атрибут “canonical”?
Атрибут rel=”canonical”, также известный как “каноническая ссылка”, “канонический URL” или “указатель на канонический URL” – это элемент разметки HTML, который указывает поисковой системе основной (или канонический) URL страницы и помогает избегать дублирования контента. HTML-атрибут rel=”canonical” является важной составляющей SEO вашего сайта, а потому следует знать как его использовать.
Идея атрибута проста: при наличии нескольких копий одной и той же страницы выбирается одна каноническая версия, а HTML-атрибут на нее указывает поисковым системам. Добавление rel=”canonical” объясняет поисковику, что именно эта выбранная страница должна быть среди выдачи.
Для чего необходимо указывать канонический URL?
Существует несколько причин, по которым стоит маркировать страницу атрибутом rel=”canonical”:
- Избежание дублирования контента. Главная причина использования rel=”canonical”. HTML-атрибут помогает поисковым роботам найти основную версию страницы среди похожих или идентичных вариантов. Это особенно важно, если URL-ссылка наполнена разнообразными атрибутами или на сайте много дублированного контента.
- Оптимизация сканирования и индексации сайта. Для того, чтобы поисковые роботы Google лучше понимали содержание и тематику вашего сайта и имели лучшую эффективность при сканировании страниц следует использовать rel=”canonical”.
- Для группировки сигналов похожих и одинаковых страниц. С помощью rel=”canonical” поисковые системы могут сгруппировать сигналы нескольких похожих страниц на одном сайте и связать их с одной URL-ссылкой.
- Для упрощения получения статистики по контенту. Если контент размещен на нескольких страницах с разными URL-ссылками, это может затруднять получение общей статистики эффективности такого контента. HTML-атрибут rel=”canonical” решает эту проблему.
Как выглядит канонический URL и где его можно найти?
Канонический URL можно определить с помощью rel=”canonical” в нескольких местах на сайте. Вот некоторые основные примеры.
Канонический URL на сайте
Канонический URL для страницы на сайте всегда помещается в <head>-раздел исходного кода страницы. В HTML-разметке это выглядит следующим образом:
<head>
<link rel=”canonical” href=”https://example.com”>
</head>
Преимущества использования rel=”canonical” в HTML-разметке:
- Позволяет пометить HTML-атрибутом любое количество страниц.
- Самый простой и распространенный способ использования атрибута.
Недостатки:
- Если разметка страниц выполняется для большого сайта (например, интернет-магазина на десятки тысяч страниц товара), то имплементация атрибута может вызвать сложности, особенно, если он не использовался с начала разработки сайта.
- Метод позволяет работать только с HTML-страницами, но не с файлами.
HTTP-заголовок
Интернет состоит не только из страниц и сайтов, но и различных типов файлов. Так, на сервере сайта может находиться документы, которые доступны в сети, обычно формата PDF. Для них также можно настроить rel=”canonical” для корректной индексации этих файлов. Это происходит в заголовке HTTP и выглядит он следующим образом:
HTTP/1.1 200 OK
Ссылка: <https://example.com/original.pdf>; rel=”canonical”
Обращаем внимание: на сегодня только поисковая система Google поддерживает определение и индексацию URL по HTML-атрибуту rel=”canonical” с помощью заголовка HTTP. Что касается изображений, то ни одна из существующих поисковых систем не поддерживает их rel=”canonical” в HTTP. Канонические ссылки для изображений следует указывать в HTML-коде страницы, на которой оно расположено.
Преимущества rel=”canonical” в HTTP:
- Не влияет на размер страницы.
- Единственный вариант индексации файлов в поисковой системе Google.
Недостатки:
- Разметка большого количества файлов потребует значительных ресурсов.
Карта сайта (Sitemap)
Еще одним вариантом использования канонического URL является его имплементация в карту сайта, она же Sitemap. Sitemap простыми словами это xml-файл, который содержит информацию о страницах сайта, которые должны быть проиндексированы поисковыми системами.
Преимущества rel=”canonical” в Sitemap:
- Дополнительное указание поисковым системам для более тщательного сканирования сайта.
Недостатки:
- В отличие от канонического URL в HTML-разметке и HTTP, canonical URL в Sitemap не является гарантией индексации.
Другие способы
Существует еще два способа канонизации ссылок.
- Можно осуществить канонизацию ссылки через 301-редирект, то есть через сервер. Принцип действия заключается в перенаправлении всех дублированных URL на основной канонический. К преимуществам можно отнести тот факт, что такой способ жестко указывает нужный URL. Среди минусов: использование способа приведет к полному удалению доступа к неканоническим ссылкам, нужен прямой доступ к серверу.
Пример выглядит использование через nginx:
rewrite ^/old-page/$ https://example.com/new-page/ permanent; - Второй способ реализуется с помощью Google Search Console. Этот инструмент позволяет выбрать приоритетный домен из числа других и использовать его в качестве основной версии сайта. Из недостатков: не является прямой альтернативой rel=”canonical” и работает только для Google.
Какой способ использования rel=”canonical” выбрать?
Учитывая функционал каждого способа можно вывести следующую формулу использования:
- Базовая нормализация страниц по адресу – с помощью rel=”canonical” в <head>.
- Дополнительно – 301-редирект для дубликатов страниц.
- Для файлов (PDF, видео, изображений) – HTTP.
- Для общей индексации – Sitemap.xml.
Да, для базового сценария хватит прямого использования HTML-атрибута в <head>-части, но именно использование нескольких способов одновременно может повысить шансы качественной индексации канонической страницы поисковыми роботами.
Когда следует использовать канонические адреса?
Несмотря на то, что в предыдущем блоке были приведены «недостатки» того или иного типа использования rel=”canonical”, эти «недостатки» являются таковыми только если сравнивать эти способы между собой. Использование атрибута действительно помогает улучшить индексацию сайта, а соответственно и SEO.
Не все пользователи сети знают, что «Большая тройка» (поисковики Google, Bing и Yahoo) в значительной степени полагаются именно на канонические URL при сканировании. Именно HTML-атрибут rel=”canonical” помогает поисковым роботам понять какие страницы следует показывать, а какие скрывать в результатах поисковой выдачи. Использование канонического URL и его определение с помощью атрибута является хорошей идеей в абсолютном большинстве случаев.
Влияние rel=”canonical” на SEO
HTML-Атрибут rel=”canonical” является техническим решением для управления дублированным контентом на сайте. Как известно, поисковые системы, в частности Google не очень любят когда контент в сети дублируется. Еще большей проблемой может стать дублирование информации в пределах одного сайта. Объясняем на примере.
Условный сайт example.com содержит два раздела по продаже гитар. Из-за смены контент-менеджера, владелец временно самостоятельно наполняет сайт контентом. Очередной звонок клиента отвлек владельца, поэтому тот продублировал страницу одной гитары и копию поместил ссылки с минимальными изменениями в разные разделы. Теперь URL выглядят так:
- https://example.com/guitars/black/no-name-model
- https://example.com/guitars/no-name-model-black
Поисковые роботы в отчаянии: они просканировали обе страницы и не поняли какую из них следует добавить в результаты поиска. В результате обе страницы окажутся ниже по рейтингу, а SEO сайта потребует доработки.
Чтобы не возникло проблем с SEO владельцу следовало указать, что один из этих адресов является каноническим. Это спасло бы основную страницу и помогло поисковику понять, что одна из этих страниц явно соответствует запросу пользователей и ее можно подтянуть выше в выдаче.
Еще одним вариантом использования канонического URL через HTML-атрибут rel=”canonical” может стать указание на оригинальную статью или блог. Например, вы написали гостевую статью для сайта вашего друга. Для использования ее на своем сайты можно указать ссылку на оригинальную статью. Это поможет SEO-оптимизации вашего сайта, ведь поисковики не воспримут скопированный материал за прямое дублирование.
Какие признаки канонического URL?
Канонизация ссылки – процесс выбора одной из имеющихся ссылок в качестве канонической. Если для одной единицы товара на сайте существует две почти одинаковых страницы, то в любом случае придется выбрать какую-то из ссылок за основную. Как это сделать?
Обратите внимание на структуру ссылки. Некоторые URL имеют более логичную и удобную структуру, а потому лучше подойдут на роль канонической ссылки: меньшая длина, целесообразное использование ключевых слов, понятный формат для пользователей. Но такой выбор не всегда очевиден. Вернемся к примеру с магазинами гитар:
- https://example.com/guitars/black/no-name-model
- https://example.com/guitars/no-name-model-black
- https://example.com/products/no-name-model-01
Владелец еще раз продублировал страницу на еще один, уже новый раздел! Какую же из этих ссылок выбрать? Ответ: любую. Если ссылки одинаково «некачественные» и вы не знаете какую из них лучше выбрать, то выберите любую из доступных.
Отсутствие канонического URL на дублированной странице хуже, чем канонизация условно неправильной ссылки.
Но если ситуация позволяет выбрать более лаконичный и понятный человеку канонический URL, то выбирайте именно его.
Канонический URL, ссылающийся сам на себя
Если существует только одна версия страницы, то следует убедиться, что rel=”canonical” ссылается сам на себя. Это ключевой момент, ведь это явный сигнал для поисковиков: «Эта страница – единственная в своем виде, именно она и только она должна быть проиндексирована и считаться канонической!»
Канонический URL, который ссылается на другую страницу
Если текущая страница является дубликатом другой, то убедитесь, что rel=”canonical” ссылается на оригинал. Вот некоторые случаи, когда каноническая ссылка может решить проблему с индексацией страниц:
- когда в дубликатах используются параметры запроса;
- если страницы являются полными или почти полными дубликатами друг друга;
- когда специально созданы очень похожие версии одной страницы (например, для разных групп целевой аудитории).
Также существует еще один сценарий использования rel=”canonical” – когда есть две страницы с одинаковым наполнением, но созданных для разных устройств. Например, одна версия example.com создана для ПК, а вторая m.example.com – для мобильных устройств. В таком случае следует использовать канонический и альтернативный адрес, чтобы сообщить поисковику об их связи и разнице между ними. По состоянию на сейчас только Google поддерживает эту реализацию.
HTML-атрибут rel=”canonical” может использоваться и для более нестандартного варианта индексации, а именно междоменной нормализации. Об этом написано чуть выше, в примере со статьей для сайта друга. Контент, который публикуется на нескольких страницах разных доменов следует маркировать rel=”canonical” для четкого сигнала поисковикам какую именно версию страницы следует индексировать и считать канонической.
Как установить канонический URL страницы с помощью атрибута rel=”canonical”?
Предположим, что две страницы вашего сайта идентичны по содержанию, но отличаются по расположению в разных разделах. Обе страницы имеют определенную массу ссылок на них с других ресурсов, поэтому сам контент является ценным. Какую из версий этой страницы следует использовать как каноническую?
1. Выберите страницу для использования rel=”canonical” для использования rel=”canonical”
Вспомним рекомендации по поводу того, какой URL является лучшим: лаконичный и понятный. Если такого нет, то обращаем внимание на показатели страницы: на какую страницу масса ссылок больше, с какой страницы получается больше заказов и посещений и тому подобное. Если по всем показателям страницы одинаковые или их отличие в пределах погрешности, то выберите ту версию, которая нравится вам больше.
2. Добавьте HTML-атрибут rel=”canonical”
Следующий шаг – добавление атрибута rel=”canonical”. Вручную это можно сделать с FTP-сервера или плагинов для CMS по типу «Диспетчер файлов WP» для WordPress. Главное – иметь доступ к редактированию файлов.
Каноническая ссылка должна быть расположена в разделе <head> страницы, иначе инструкции по индексации не будут выполняться поисковиками.
В целом, это все. Вся последующая работа уже будет на плечах поисковиков. Впрочем, это не значит, что можно один раз настроить HTML-атрибут и забыть – для того, чтобы все работало как нужно, следует проверять индексацию страниц на предмет проблем и ошибок при поиске.
Какие ошибки встречаются при нормализации URL?
Вот некоторые основные ошибки, которые встречаются при использовании rel=”canonical” и канонизации страниц:
- Использование файла robots.txt для нормализации вместо Sitemap.
- Использование разных URL в качестве канонических для одной страницы. Например, указать один «канон» через Sitemap, а другой через атрибут – плохая идея.
- Использование части URL для канонизации. HTML-атрибут rel=”canonical” требует полного канонического адреса сайта (вместе с https:/).
- Использование noindex для запрета страницы как канонической для других страниц. Такое действие приведет к полной блокировке страницы в Поиске.
Подробнее о рекомендациях по использованию можно узнать из официальной документации Google.
Выводы
HTML-атрибут rel=”canonical” – мощный инструмент для работы с SEO-оптимизацией любого сайта. Особенно полезным он станет для крупных сайтов и интернет-магазинов, которые содержат много дублированных страниц. Впрочем, некорректное использование атрибута и нормализации URL может привести к проблемам с индексацией и видимостью страниц в Поиске.




