Зміст статті

Атрибут rel=”canonical” — інструмент для вирішення проблеми дублювання контенту. WEDEX ділиться тим, як можна використати атрибут та які поширені помилки можуть відбутися.
Що таке атрибут “canonical”?
Атрибут rel=”canonical”, також відомий як «канонічне посилання», «канонічний URL» або «вказівник на канонічний URL» — це елемент розмітки HTML, який вказує пошуковій системі основний (або канонічний) URL сторінки та допомагає уникати дублювання контенту. HTML-атрибут rel=”canonical” є важливою складовою SEO вашого сайту, а тому слід знати як його використовувати.
Ідея атрибуту проста: за наявності декількох копій однієї і тієї ж самої сторінки обирається одна канонічна версія, а HTML-атрибут на неї вказує пошуковим системам. Додавання rel=”canonical” пояснює пошуковику, що саме ця обрана сторінка повинна бути серед видачі.
Для чого необхідно вказувати канонічний URL?
Існує декілька причин, через які варто маркувати сторінку атрибутом rel=”canonical”:
- Уникнення дублювання контенту. Головна причина використання rel=”canonical”. HTML-атрибут допомагає пошуковим роботам знайти основну версію сторінки серед схожих або ідентичних варіантів. Це особливо важливо, якщо URL-посилання наповнене різноманітними атрибутами або на сайті багато дубльованого контенту.
- Оптимізація сканування та індексації сайту. Для того, щоб пошукові роботи Google краще розуміли зміст та тематику вашого сайту та мали кращу ефективність при скануванні сторінок слід використовувати rel=”canonical”.
- Для групування сигналів схожих та однакових сторінок. За допомогою rel=”canonical” пошукові системи можуть згрупувати сигнали декількох схожих сторінок на одному сайті та звʼязати їх з одним URL-посиланням.
- Для спрощення отримання статистики по контенту. Якщо контент розміщений на декількох сторінках з різними URL-посиланнями, це може ускладнювати отримання загальної статистики ефективності такого контенту. HTML-атрибут rel=”canonical” вирішує цю проблему.
Як виглядає канонічний URL та де його можна знайти?
Канонічний URL можна визначити за допомогою rel=”canonical” у декількох місцях на сайті. Ось деякі основні приклади.
Canonical URL на сайті
Канонічний URL для сторінки на сайті завжди поміщується в <head>–розділ вихідного коду сторінки. В HTML-розмітці це виглядає наступним чином:
<head>
<link rel=”canonical” href=”https://example.com”>
</head>
Переваги використання rel=”canonical” в HTML-розмітці:
- Дозволяє помітити HTML-атрибутом будь-яку кількість сторінок.
- Найпростіший та найпоширеніший спосіб використання атрибуту.
Недоліки:
- Якщо розмітка сторінок виконується для великого сайту (наприклад, інтернет-магазину на десятки тисяч сторінок товару), то імплементація атрибуту може викликати складнощі, особливо, якщо він не використовувався з початку розробки сайту.
- Метод дозволяє працювати лише з HTML-сторінками, але не з файлами.
HTTP-заголовок
Інтернет складається не тільки зі сторінок та сайтів, а й різноманітних типів файлів. Так, на сервері сайту може знаходитися документи, які доступні в мережі, зазвичай формату PDF. Для них також можна налаштувати rel=”canonical” для коректної індексації цих файлів. Це відбувається в заголовку HTTP та виглядає він наступним чином:
HTTP/1.1 200 OK
Link: <https://example.com/original.pdf>; rel=”canonical”
Звертаємо увагу: станом на сьогодні лише пошукова система Google підтримує визначення та індексацію URL за HTML-атрибутом rel=”canonical” за допомогою заголовка HTTP. Щодо зображень, то жодна з наявних пошукових систем не підтримує їхню rel=”canonical” в HTTP. Канонічні посилання для зображень слід вказувати в HTML-коді сторінки, на якій воно розташоване.
Переваги rel=”canonical” в HTTP:
- Не впливає на розмір сторінки.
- Єдиний варіант індексації файлів в пошуковій системі Google.
Недоліки:
- Розмітка великої кількості файлів потребуватиме значних ресурсів.
Мапа сайту (Sitemap)
Ще одним варіантом використання канонічного URL є його імплементація в мапу сайту, вона ж Sitemap. Sitemap простими словами це xml-файл, який містить інформацію про сторінки сайту, які повинні бути проіндексовані пошуковими системами.
Переваги rel=”canonical” в Sitemap:
- Додаткова вказівка пошуковим системам для більш ретельного сканування сайту.
Недоліки:
- На відміну від канонічного URL в HTML-розмітці та HTTP, canonical URL в Sitemap не є гарантією індексації.
Інші способи
Існує ще два способи канонізації посилань.
- Можна здійснити канонізацію посилання через 301-редирект, тобто через сервер. Принцип дії полягає у перенаправленні усіх дубльованих URL на основний канонічний. До переваг можна віднести той факт, що такий спосіб жорстко вказує потрібний URL. Серед мінусів: використання способу призведе до повного видалення доступу до неканонічних посилань, потрібен прямий доступ до сервера.
Приклад виглядає використання через nginx:
rewrite ^/old-page/$ https://example.com/new-page/ permanent;
- Другий спосіб реалізується за допомогою Google Search Console. Цей інструмент дозволяє обрати пріоритетний домен з поміж інших та використовувати його в якості основної версії сайту. З недоліків: не є прямою альтернативою rel=”canonical” та працює лише для Google.
Який спосіб використання rel=”canonical” обрати?
З огляду на функціонал кожного способу можна вивести наступну формулу використання:
- Базова нормалізація сторінок за адресою — за допомогою rel=”canonical” в <head>.
- Додатково — 301-редирект для дублікатів сторінок.
- Для файлів (PDF, відео, зображень) — HTTP.
- Для загальної індексації — Sitemap.xml.
Так, для базового сценарію вистачить прямого використання HTML-атрибуту в <head>-частині, але саме використання кількох способів одночасно може підвищити шанси якісної індексації канонічної сторінки пошуковими роботами.
Коли слід використовувати канонічні адреси?
Не дивлячись на те, що у попередньому блоці були наведені «недоліки» того чи іншого типу використання rel=”canonical”, ці «недоліки» є такими лише якщо порівнювати ці способи між собою. Використання атрибуту дійсно допомагає покращити індексацію сайту, а відповідно й SEO.
Не всі користувачі мережі знают, що «Велика трійка» (пошуковики Google, Bing та Yahoo) значною мірою покладаються саме на канонічні URL під час сканування. Саме HTML-атрибут rel=”canonical” допомагає пошуковим роботам зрозуміти які сторінки слід показувати, а які приховувати в результатах пошукової видачі. Використання канонічного URL та його визначення за допомогою атрибуту є гарною ідеєю в абсолютній більшості випадків.
Вплив rel=”canonical” на SEO
HTML-Атрибут rel=”canonical” є технічним рішенням для керування дубльованим контентом на сайті. Як відомо, пошукові системи, зокрема Google не дуже полюбляють коли контент в мережі дублюється. Ще більшою проблемою може стати дублювання інформації в межах одного сайту. Пояснюємо на прикладі.
Умовний сайт example.com містить два розділи з продажу гітар. Через зміну контент-менеджера, власник тимчасово самостійно наповнює сайт контентом. Черговий дзвінок клієнта відволік власника, тому той продублював сторінку однієї гітари і копію помістив посилання з мінімальними змінами до різних розділів. Тепер URL виглядають так:
- https://example.com/guitars/black/no-name-model
- https://example.com/guitars/no-name-model-black
Пошукові роботи в розпачі: вони просканували обидві сторінки і не зрозуміли яку з них слід додати в результати пошуку. В результаті обидві сторінки опиняться нижче за рейтингом, а SEO сайту потребуватиме доопрацювання.
Щоб не виникло проблем з SEO власнику слід було вказати, що одна з цих адрес є канонічною. Це врятувало б основну сторінку та допомогло пошуковику зрозуміти, що одна з цих сторінок явно відповідає запиту користувачів та її можна підтягнути вище у видачі.
Ще одним варіантом використання канонічного URL через HTML-атрибут rel=”canonical” може стати вказівка на оригінальну статтю або блог. Наприклад, ви написали гостьову статтю для сайта вашого друга. Для використання її на своєму сайти можна вказати посилання на оригінальну статтю. Це допоможе SEO-оптимізації вашого сайту, адже пошуковики не сприймуть скопійований матеріал за пряме дублювання.
Які ознаки канонічного URL?
Канонізація посилання — процес вибору одного з наявних посилань в якості канонічного. Якщо для однієї одиниці товару на сайті існує дві майже однакових сторінки, то в будь-якому випадку доведеться обрати якесь з посилань за основне. Як це зробити?
Зверніть увагу на структуру посилання. Деякі URL мають логічнішу та зручнішу структуру, а тому краще підійдуть на роль канонічного посилання: менша довжина, доцільне використання ключових слів, зрозумілий формат для користувачів. Але такий вибір не завжди очевидний. Повернемося до прикладу з магазинами гітар:
- https://example.com/guitars/black/no-name-model
- https://example.com/guitars/no-name-model-black
- https://example.com/products/no-name-model-01
Власник ще раз продублював сторінку на ще один, вже новий розділ! Яке ж цих посилань обрати? Відповідь: будь-яке. Якщо посилання однаково «неякісні» і ви не знаєте яке з них краще обрати, то оберіть будь-яке з доступних.
Відсутність канонічного URL на дубльованій сторінці гірше, ніж канонізація умовно неправильного посилання.
Але якщо ситуація дозволяє обрати більш лаконічний та зрозумілий людині канонічний URL, то обирайте саме його.
Канонічний URL, що посилається сам на себе
Якщо існує лише одна версія сторінки, то слід переконатися, що rel=”canonical” посилається сам на себе. Це ключовий момент, адже це явний сигнал для пошуковиків: «Ця сторінка — єдина у своєму виді, саме вона і тільки вона повинна бути проіндексована та вважится канонічною!»
Канонічний URL, який посилається на іншу сторінку
Якщо поточна сторінка є дублікатом іншої, то переконайтеся, що rel=”canonical” посилається на оригінал. Ось деякі випадки, коли канонічне посилання може вирішити проблему з індексацією сторінок:
- коли в дублікати використовуються параметри запиту;
- якщо сторінки є повними або майже повними дублікатами один одного;
- коли спеціально створено дуже схожі версії однієї сторінки (наприклад, для різних груп цільової аудиторії).
Також існує ще один сценарій використання rel=”canonical” — коли є дві сторінки з однаковим наповненням, але створених для різних пристроїв. Наприклад, одна версія example.com створена для ПК, а друга m.example.com — для мобільних пристроїв. В такому випадку слід використати канонічну та альтернативну адресу, щоб повідомити пошуковик про їхній звʼязок та різницю між ними. Станом на зараз тільки Google підтримує цю реалізацію.
HTML-атрибут rel=”canonical” може використовуватися і для більш нестандартного варіанту індексації, а саме міждоменну нормалізацію. Про це написано трохи вище, у прикладі зі статтею для сайта друга. Контент, який публікується на кількох сторінках різних доменів слід маркувати rel=”canonical” для чіткого сигналу пошуковикам яку саме версію сторінки слід індексувати та вважати канонічною.
Як встановити канонічний URL сторінки за допомогою атрибуту rel=”canonical”?
Припустимо, що дві сторінки вашого сайту ідентичні за змістом, але відрізняються за розташуванням у різних розділах. Обидві сторінки мають певну масу посилань на них з інших ресурсів, тому сам контент є цінним. Яку з версій цієї сторінки слід використати як канонічну?
1. Оберіть сторінку для використання rel=”canonical”
Згадаємо рекомендації з приводу того, який URL є кращим: лаконічний та зрозумілий. Якщо такого немає, то звертаємо увагу на показники сторінки: на яку сторінку маса посилань більше, з якої сторінки отримується більше замовлень та відвідувань тощо. Якщо за всіма показниками сторінки однакові або їхня відмінність у межах похибки, то оберіть ту версію, яка подобається вам більше.
2. Додайте HTML-атрибут rel=”canonical”
Наступний крок — додавання атрибуту rel=”canonical”. Вручну це можна зробити з FTP-сервера або плагінів для CMS по типу «Диспетчер файлів WP» для WordPress. Головне — мати доступ до редагування файлів.
Канонічне посилання повинно бути розташованим у розділі <head> сторінки, інакше інструкції з індексації не будуть виконуватися пошуковиками.
В цілому, це все. Вся наступна робота вже буде на плечах пошуковиків. Втім, це не означає, що можна один раз налаштувати HTML-атрибут та забути — для того, щоб все працювало як потрібно, слід перевіряти індексацію сторінок на предмет проблем та помилок під час пошуку.
Які помилки трапляються під час нормалізації URL?
Ось деякі основні помилки, які трапляються під час використання rel=”canonical” та канонізації сторінок:
- Використання файлу robots.txt для нормалізації замість Sitemap.
- Використання різних URL в якості канонічних для однієї сторінки. Наприклад, вказати один «канон» через Sitemap, а інший через атрибут — погана ідея.
- Використання частини URL для канонізації. HTML-атрибут rel=”canonical” вимагає повної канонічної адреси сайти (разом з https:/).
- Використання noindex для заборони сторінки як канонічної для інших сторінок. Така дія призведе до повного блокування сторінки в Пошуку.
Детальніше про рекомендації з використання можна дізнатися з офіційної документації Google.
Висновки
HTML-атрибут rel=”canonical” — потужний інструмент для роботи із SEO-оптимізацією будь-якого сайту. Особливо корисним він стане для великих сайтів та інтернет-магазинів, які містять багато дубльованих сторінок. Втім, некоректне використання атрибуту та нормалізації URL може призвести до проблем з індексацією та видимістю сторінок в пошуку.




