chok-chok-shop.ru

Дубликат страницы без тега canonical. Канонические URL-адреса в WordPress: когда и как использовать их

Здравствуйте, друзья!

Сегодня будет очень важная статья, которая очень тесно пересекается с темой про дубли страниц.

Так, что внимательно вникаем и, если что-то непонятно, то пишите в комментарии. Темой обсуждения является животрепещащий атрибут rel="canonical", который призван для предотвращения дублированного контента и упрощения индексации поисковым системам.
Пройдемся по каждому вопросу по порядку, чтобы сложилась целостная картина.

Принцип работы атрибута rel="canonical"

Атрибут или тег canonical (как еще называют) используется для того, чтобы дать поисковым системам понять, какой адрес правдивый и является главным для каждой страницы на сайте.

Rel="canonical" - это один из важнейших моментов в оптимизации любого сайта, который позволяет решить проблему дублированного контента. Особая нужда в его использовании появляется при использовании различных дижков для создания сайтов, таких как: WordPress, phpBB и других.

Различные движки помимо основных страниц генерируют еще и другие документы с точно таким же контентом, но выполняющие совершенно другие задачи, например:

  • версия страницы для печати;
  • мобильная версия статьи;
  • и любые другие страницы с таким же контентом, но с другими адресами.

Если взять сайт на WordPress, то при включенной функции древовидных комментариев доступна кнопка "Ответить" под каждым комментом.

Она делает адрес совершенно другим, а вот контент никуда не изменяется. Происходит явное дублирование контента, что очень плохо.

Одним из самых действенных способов предотвратить появление такой страницы в индексе поисковых систем является добавления на все подобные страницы атрибута rel="canonical", который укажет, что только статья является предпочтительным документом для индексации, а все остальные в индекс брать не нужно.

Как прописывать rel="canonical"

На различных движках (например, WordPress) добавление атрибута rel="canonical" происходит в автоматическом режиме. Также атрибут добавляется с помощью различных SEo плагинов.

Если же хотим добавить canonical в ручном режиме, то в область ресурса стоит добавить следующую строчку.

< link rel = "canonical" href = "адрес страницы" / >

Данный строку нужно обязательно добавить в секцию шапки сайта, то есть между открывающим и закрывающим тегом . Иначе поисковые системы проигнорируют ваше указание в виде этого атрибута. Также стоит добавлять его на каждую страницу, которая не является главной и доступна по другому адресу.

Если взять в пример ситуацию выше с адресами страниц, создаваемые кнопками ответа на комментарии на WordPress, то в исходном коде каждой такой страницы можно видеть атрибут rel="canonical".

Как видим, канонический адрес указывает на основную страницу, когда исходный код я просматривал по адресу:

http://i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

http : //i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

Такая страница благодаря атрибуту канонических адресов в индекс не попадет. Поисковики прекрасно примут во внимание ваше указание.

Рассмотрев основной принцип работы данного атрибута, можно перейти к следующему вопросу материала.

В каких случаях использовать?


Теперь стоит рассмотреть основные ошибки, которые могут допускаться и их стоит избегать.

Основные ошибки


Когда разобрали основные ошибки, которых стоит избегать и которые чаще всего употребляются, стоит упомянуть плагины WordPress и некоторые моменты работы с атрибутом rel="canonical" на том движке.

Сanonical в плагинах WordPress

Начнем с одного из самых популярных решений на рынке - all in one seo pack. Плагин хорош и добавляет данный атрибут в код каждой страницы, удаляя при этом стандартный canonical, создаваемый средствами движка. Для этого стоит включить соответствующую настройку.

Существует 2 проблемы, которые могут препятствовать нормальной индексации сайта и помочь конкурентам насолить нам.

Первый момент касается неправильной работы атрибута со страницами пагинации. Выше я писал, что каждая страница должна быть каноничной. Плагин же в rel="canonical" вписывает адрес на первую страницу (на главный адрес омена) из всего списка пагинации.


Такой вариант может существовать, но он не совсем правильный, так как все страницы пагинации с большой вероятностью могут быть исключены из индекса ПС. Если это недопустимо, то проблему нужно решать.

Вторым моментом является косяк, который я описывал в соответствующей статье (). Он может помочь нашим конкурентам добавить нежелательные страницы в индекс с помощью инструментов addurl в поисковый индекс. Данный косяк конечно же исправляется и хорошо, что средствами самого же плагина, активировав определенную настройку "No Pagination for Canonical URLs".

На данном моменте тут я подробно останавливаться не буду, так как вопрос не маленький. Если хотите избежать второй проблемы при использовании этого плагина, то читайте статью по ссылке в предыдущем абзаце. Там все очень подробно расписано, что да как.

Вторым плагином на обозрении стоит Platinum seo pack. К страницам пагинации он относится с уважением. Проблема заключается лишь в дублировании rel="canonical". Просмотрев исходный код страницы, можно увидеть, что при включенной функции добавления атрибута, не убирается стандартный атрибут, выводимый движком.


На данный момент, устранение проблемы дублированных страниц является одной из самых важных при оптимизации сайта. В большинстве случаев для решения этой проблемы лучше всего использовать .

Но, когда мы или не можем использовать 301 редирект, или нам необходимы страницы для просмотра пользователями, то нам на помощь приходит атрибут rel= «canonical».

С помощью этого атрибута можно довольно быстро устранить проблемы дублирующего контента.

Как прописать rel= «canonical»?

На странице сайта (основной способ)

Чтобы для текущей страницы указать ее каноническую ссылку, то в секции нужно прописать следующее:

< link rel= "canonical" href= "http://site.com/canonical-link.html" />

Очень важно прописать именно в секции HEAD, так как если вы случайно пропишите данный атрибут не в этой секции, то данная инструкция будет проигнорированная поисковыми системами.

Через xml-карту сайта

Для каждой страницы в xml-карте сайта вы можете прописать её каноническую ссылку. Но, в данном случае, поисковые системы могут проигнорировать данные рекомендации.

Через ответ сервера (лучше всего для не html документов)

Link: ; rel="canonical".

Link: ; rel="canonical".

Но, следуют учесть, что на данный момент Google поддерживает данный элемент заголовка только для Веб-поиска.

Когда нужно использовать канонические ссылки

Если вы точно знаете в каком случае у вас на сайте появляются дубли

Если вы четко понимаете причину возникновения похожих или очень схожих страниц у вас на сайте и, при этом, каждая такая страница должна существовать на сайте, то желательно определиться какая из этих страниц серии является основной и со всех других страниц проставить канонические ссылки на эту одну главную.

Когда сложно или невозможно реализовать 301 редирект

В общем лучше всего использовать 301 редирект, но если это довольно сложно или долго реализовывать, то можно воспользоваться и атрибутом rel=”canonical”. По заявлениям Google, передаваем вес через канонические ссылки абсолютно идентичный весу, который передает 301 редирект.

Несколько страниц для одной серии продуктов

Если у вас в интернет магазине есть серия товаров, которая отличается, например, только цветом, то лучше выбрать один товар в качестве главного (типичного) и на него проставить канонические ссылки с других продуктов.

При разных сортировках товаров в каталоге

Если на вашем сайте товары можно сортировать разными способами и параметр сортировки указывается в урле:

При создании страницы каталога со всеми продуктами

Каноническая ссылка не является индексируемой

  • страница отдает 200 код сервера
  • на странице нет запрета индексации (через мета тег robots и noindex)

Несколько ссылок rel=canonical с одной страницы

Для одной страницы должна быть одна каноническая страница. Если указанно несколько страниц, то в таком случае будет учтена только первая инструкция.

Разные канонические URL

Следите за тем, чтобы всегда указывать одни и те же канонические страницы при разной реализации (например, через xml-карту сайта и через rel=”canonical” на самой странице).

Неправильное использование относительных ссылок

В общем случае, при указании канонических ссылок всегда желательно прописывать абсолютные ссылки

Тогда поисковые системы будут просто игнорировать данные инструкции.

Проверка использование rel=»canonical» на своем сайте

После того, как вы настроили все канонические ссылки у себя на сайте, то желательно сделать проверку всего сайта на то, как будут видеть эти все инструкции поисковые роботы. Для этого лучше всего воспользоваться программой Screaming Frog SEO Spider.

После индексации вашего сайта эта программа в удобном для вас виде предоставит вам полную информацию по всем страницам

  • на которых стоит атрибут rel=”canonical” и на какие именно страницы он указывает
  • на какие страницы сайта проставлены канонические ссылки
  • какие страницы без атрибута rel=”canonical”

Вся эта информация будет на вкладке Directives

Следует не забыть провести некоторые дополнительные настройки:

1. Убедиться, что на вкладке Basic выставлена галочка напротив Crawl Canonical

Чтобы осуществлять правильное продвижение страниц сайта в поисковых системах, необходимо сообщать роботам, какие URL более предпочтительны для попадения в индекс. Это задаётся с помощью специальных тегов.

Что такое rel canonical?

Остановимся подробнее на теге rel=»canonical». Его основная цель - борьба с дублями страниц и неинформативными страницами (например страницами пагинации), а также повышение качества индексации с помощью прописывания приоритетного адреса.

У меня был сайт с ограниченным краулинговым бюджетом. То есть по факту там было тысяч 10 страниц, но в индексе могли быть только 2 тысячи (потому что сайт был молодой и не трастовый). В итоге те страницы, которые мне были нужны в индексе, часто туда не попадали. Помог каноникал — проставление со страниц пагинации каноникала на основные URL позволило четко дать поисковикам понять, какие страницы должны быть в индексе.

Что такое каноническая ссылка?

Тег canonical будет чрезвычайно полезен, если на вашем сайте есть страницы-дубли, которые имеются в доступе по различным адресам. С помощью него необходимо прописать приоритетный канонический URL для восприятия поисковиками.

Что важно - будет также передаваться ссылочный вес и прочие характеристики страницы (PageRank и др.).

Этот атрибут указывается внутри тега на URL-дубликатах с указанием предпочитаемого URL. Оформляется он таким образом:

Для чего нужен каноникал?

При наличии похожих страниц в индексации поисковиками участвуют все они одновременно. В итоге ни одна из них в полной мере не продвигается по причине того, что внутренние ссылки имеются на обе страницы. Поисковик не знает, какой из них нужно отдать приоритет.

То же самое касается и внешних ссылок - продвигается не один URL, а несколько, а вес также распределяется между ними. И сайт находится на более низких позициях, чем мог бы быть.

Благодаря каноникал в индексе поисковиков будет предпочитаемый канонический URL.

Примеры использования

Например, у вас на сайте есть печатная версия страницы. Или отдельный урл для мобильной версии. И вы ставите каноникал с них на основную страницу, в итоге эта основная страница получает больший вес и плюс при ранжировании, а из индекса убирается куча мусора.

Как каноникал используется для пагинации

Нужно проставить rel canonical со страниц пагинации (site.ru/category/page/2) на первую из них (site.ru/category).

Мнения о настройке пагинации разнятся - некоторые специалисты говорят о необходимости закрытия от поисковиков всех страниц пагинации, другие - о том, что лучше их оставить в доступе роботов поисковых систем.

Яндекс рекомендует со всех страниц пагинации настраивать каноническую ссылку на первую из них. Как итог - яндекс-робот воспримет, что именно первую страницу необходимо индексировать. Про индексацию товаров уточняется, что по другим ссылкам Яндекс всё равно будет переходить.

Специалисты Google склоняются к следующим вариантам:

  1. оставить всё по-прежнему - поисковик по-разному распознаёт и воспринимает различные виды страниц;
  2. создать отдельный URL-адрес «Показать всё» и установить его как канонический - особенно рекомендуется для многостраничных статей;
  3. прописать в теге линк атрибуты rel=»prev» и rel=»next» с целью фиксации взаимосвязи между URL-адресами; поисковик будет выдавать первый из них.

А вот видос Деваки, где он подробно поясняет за пагинацию:

Атрибуты rel=»next» и rel=»prev»

Есть также и другое мнение — типа страницы пагинации закрывать не надо, что они наоборот должны получать дополнительный трафик. И тут важны два момента:

  • Все URL должны иметь уникальный параметр тега Title, уникальный текст и meta-теги;
  • Если Вы больше ориентируетесь на Google, то рекомендовано обязательное использование атрибутов rel=»next» и rel=»prev», которые нужно настроить так, чтобы каждая предыдущая страница ссылалась на следующую. На корневом адресе задаётся URL следующего, на последующих - URL предыдущей и следующей, на последней - только предыдущей.

Можно прописать пагинацию этими тегами, а каноническую ссылку оформить на первую или на главную страницу - в зависимости от особенностей ресурса.

Тема с SEO пагинатором

Вот допустим один из блогов (Sawynih или как-то так, уже не помню) писал о кейсе, когда страницы пагинации давали дополнительный трафик.

Если на разных URL представлен похожий товар, навигацию можно задать следующими способами:

  1. Прописать уникальные значения параметров автоматически, собирая заголовки из отдельных частей, к примеру:

    (купить|заказать|приобрести) юбки в (саратове|ростове|астрахани) (по низкой цене|выгодно|дешево) со скидкой (в магазине|в интернет магазине)

    Будут созданы уникальные значения метатегов.

  2. Самым эффективным и трудоемким является самостоятельное прописывание этих параметров, вручную. Все заголовки будут уникальными и очень сильно отличаться друг от друга, в том числе по смыслу. Это позволит продвинуть каждый URL по низкочастотным и низко конкурентным ключевым запросам в ТОП выдачи поисковиков. Благодаря применению этого способа расширится семантическое ядро. Плюс также в том, что для интернет-магазина множество статей писать нецелесообразно.

Важно осуществить эту работу один раз индивидуально для каждого URL. Параметры будут зафиксированы поисковиками.

Настройка Canonical для WordPress

Многие плагины для WordPress прекрасно работают с данным тегом.

Большинство из них просты в применении - активируем плагин, а канонические ссылки прописываются автоматически. В других SEO-плагинах достаточно установить галочку возле этого параметра в настройках. Если какая-то статья относится одновременно к разным категориям, то каноническая ссылка фиксируется самостоятельно.

При использовании плагина Yoast SEO и расположения поста в разных категориях, поисковик будет видеть только одну страницу.

Что еще полезно знать о каноникал?

Важно подчеркнуть следующие моменты:

  1. Тег canonical - не директива, а подсказка, которую следует учесть и проанализировать, выделив наиболее подходящий URL для поисковой выдачи.
  2. Касаемо оформления канонических ссылок отсутствует запрещающий момент в виде относительного пути. Даже в случае введения тега со ссылкой на документ, относительные пути станут восприниматься так, как прописано в базовом URL.
  3. Канонические страницы могут содержать не абсолютно одинаковое наполнение, и это логично. Могут присутствовать незначительные различия.
  4. Даже при наличии ошибки 404, контент будет индексироваться. Но рекомендуется указывать рабочие URL в качестве канонических.
  5. Если канонический url пока не проиндексирован, остаётся ждать - обычно недолго. Когда он распознается, подсказка будет пересмотрена.
  6. Можно использовать редирект - поисковик воспримет перенаправление и будет учитывать другой адрес.
  7. Рекомендуется задавать идентичный тег rel canonical, чтобы результат канонизации был оптимальным.
  8. Канонический урл может прописываться исключительно с текущего домена. Для указания урла с другого домена, следует использовать 301 редирект.
  9. Как оформляются канонические url, можно изучить на примере сайта wikia.com, открыв исходный код страницы http://starwars.wikia.com/wiki/Nelvana_Limited, содержащий canonical url http://starwars.wikia.com/wiki/Nelvana
    Обе ссылки практически одинаковы, но в первой прописан атрибут каноникал - и Google будет отображать версию, заданную в этом параметре.
  10. Вопросы применения каноникал можно задать в официальном блоге для вебмастеров поисковика Google.

В данном случае каноникал проставлен на чёрную овцу

Преимущества, связанные с умением правильно настраивать индексацию с помощью тега canonical:

  • избавление от похожего контента, связанного с недостатками движка, а также созданного искусственно целенаправленными действиями конкурентов;
  • отсутствие необходимости в применении robots.txt для запрета индексации отдельных страниц и угождения всем поисковикам.

Сегодня мы поговорим про атрибут Rel=” Canonical” и в каких случаях его необходимо прописывать.

Что означает Rel Canonical?

Это атрибут указывается в теге и используется для отображения канонических страниц на сайте. Каноническая страница – является главной страницей, именно она будет при на сайте.

История Canonical

12 февраля 2009 года Google представил атрибут canonical, который был создан, чтобы избавить сайт от дублированных страниц, указав необходимый URL адрес (каноническую страницу).

Где прописывать rel canonical

Атрибут тега rel canonical прописывается в разделе и может встречаться только 1 раз на странице. Данный тег не может указывается в других разделах на сайте или

.

Каноническая ссылка – что это?

Каноническая страница – более приоритетная страница по сравнению с остальными.

Давайте разберем конкретный пример:

У нас имеется каноническая страница, на которую мы хотим ссылаться в случае с дублями.

Тег link с атрибутом каноникал будет являться канонической ссылкой .

Данную проблему мы можем решить другим способом. Со страниц дублей будет идти ReDirect 301 на главную (каноническую страницу). О 301-редиректе я расскажу в следующей статье.

Для главной страницы атрибут canonical необязателен, так как мы указываем в robots.txt директиву Host.

Что делать с пагинацией в интернет-магазине?

Нужен ли Canonical, где имеются карточки товаров? На этот вопрос уже ответил Яндекс:

“Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel="canonical" тега на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.
Например, страница сайт.рф/ромашки/1 - каноническая, с неё начинается каталог, а страницы вида сайт.рф/ромашки/2 и сайт.рф/ромашки/3 - неканонические, в поиск их можно не включать. Это не только предотвратит возможное дублирование контента, но и позволит указать роботу, какая именно страница должна находиться в выдаче по запросам. “

То если страницы пагинаций вида:

http://site.ru /category-name/” />
Рекомендую ознакомится со следующим списком статей, который помогут сделать внутреннюю оптимизацию сайта качественно:



Как правило, проблемы с дублями возникают со стороны платформы (чаще всего это известные CMS Joomla, Opencart и прочие). Opencart вообще можно вынести в отдельную категорию, так как не до конца решена проблема, во всяком случае у меня разобраться не получилось и пришлось переносить все на другой движок. (Никому не рекомендую данный движок)


Но так же существуют ошибки со стороны оптимизатора которые я описал ниже.

Основные ошибки написания Canonical

Неверный ответ сервера.

Страница, на которую ставим тег link rel=” canonical” должна быть работоспособной. То есть ответ сервера должен быть 200.

Проверить robots.txt

Возможно, что данная страница закрыта от индексации поисковых роботов.

Дублирование и расположение атрибута.

Важно, чтобы тег встречался всего 1 раз на странице и располагался только в теге .

Отсутствие цепочек ссылок.

Со всех дублирующихся страниц все канонические ссылки указывают на 1 каноническую страницу. Чтобы не получилось, что одна ссылка ссылается на другую вторая на третью и так далее.

Rel Canonical в CMS Wordpress

Прописать тег Canonical в CMS Wordpress вы можете c помощью плагинов:



В SEO Yoast ограниченный функционал, можно указать только в поле необходимый канонический URL.

Плагин All in SEO



В All in SEO имеется возможность так же указывать канонический URL, а так же запрещать пагинацию для канонических URL(то есть ПС не будет индексировать эти страницы).

Заключение

Учитывая проблемы многих платформ, данный атрибут обязательно стоит учитывать, ведь он влияет на индексацию страниц вашего сайта.

Думаю, я рассказал большую часть про атрибут Rel=” Canonical”. Пишите в комментариях, как вы используете канонические ссылки на своих сайтах.

Доброго дня читателям. Для большинства людей канонические URL – это вещь крайне загадочная, и зачастую они могут быть ошибочно использованы для таких операций, как 301 редирект. Пользователи знают, что такие ссылки имеют отношение к SEO, но не совсем уверены в том, как их можно использовать. Говоря же о WordPress (в противовес HTML сайту), то здесь не так легко вручную прописывать канонические ссылки для каждой отдельной страницы вашего сайта, без использования плагина, так как это идет вразрез с тем, как работает шаблон системы управления содержимым сайта.

Данная статья поможет прояснить некоторые вопросы, которые могут возникнуть у пользователей WordPress в связи с использованием канонических URL. Не WordPress пользователи также найдут эту статью полезной, потому что смогут узнать основные принципы и затем применить эти правила к собственной системе управления контентом или обогатить свой опыт разработчика. Как бы то ни было, эта статья может показаться вам сложной в освоении в том случае, если у вас не достает технических знаний о WordPress или базовой информации о HTML и поисковой оптимизации (SEO). Мы осветили все термины, чтоб вы могли с ними познакомиться в первую очередь. Но, в любом случае, из этой публикации вы сможете почерпнуть тот необходимый базис, с которого можно начать гуглить, чтоб найти больше информации для получения более полной картины.

Что представляет из себя канонический URL?

Канонический URL (также известен, как rel=canonical, канонический тег и под другими названиями) – это то, на что ссылаются поисковые системы, когда они видят дублированные версии страницы на вашем сайте или же в интернет-пространстве. Сейчас этот прием используется для решения сложных проблем, связанных с дублированным контентом, так как часто он является лучшим решением, чем использование 301 редиректа.

Возможно, вы думаете, что на вашем сайте нет дублированного контента. И это здорово, если вы следите за тем, чтоб ваш контент не повторялся на множестве страниц. В противном случае, это может привести к понижению ранга вашего сайта в поисковой выдаче.

Если на вашем сайте есть повторяющийся текст, постарайтесь серьезно подумать над этой проблемой: если бы вы были поисковой системой, которая пытается ответить на запрос пользователя, вы бы выдали этому пользователю две идентичные страницы в результатах поисковой выдачи? Конечно же, нет! Это же совершенно бесполезно. Вы бы выдали им столько разных результатов (в поисковой выдаче), чтоб они могли найти то, что им необходимо.

Таким образом, если контент на вашем сайте повторяется снова и снова, ожидаемо, что Google просто не будет ранжировать такие страницы. И это нехорошо, если вы хотите занимать хоть какие-то позиции в поисковой выдаче.

Ссылки на дублированный контент, о существовании которых вы даже не подозреваете

Хорошо, теперь давайте вернемся назад и предположим, что вы все сделали правильно и уверены в том, что все ваши страницы абсолютно уникальны. Но, возможно, на вашем сайте все же присутствуют «скрытые» дублированные URLы, о которых вы знать ничего не знаете (на самом деле они не скрытые, я просто их так назвал). Это может вас удивить, но знали ли вы что поисковики воспринимают следующие URL, как полностью самостоятельные, даже не смотря на то, что для вас это одно и то же, и отображает одинаковый контент?

http://www.examplesite.com (заметили www?)

http://examplesite.com

https://examplesite.com (заметили https?)

http://www.examplesite.com/ (заметили слэш в конце?)

http://examplesite.com/index.php

Вот почему вам нужен канонический URL в теге HTML-кода всех ваших страниц. Необходимо оповестить поисковые машины о том, на какую версию типов URL приведенных выше или других они должны обращать внимание.

Это значит, что вы должны раз и навсегда решить отказаться ли вам или нет от использования www во всех ссылках вашего веб-проекта. Это должно стать вашей стратегией перелинковки сайта как внутри него, так и за его пределами. И это должны знать все, кто используют ваши URL: фрилансеры, работающие на вас, ваши партнеры, совладельцы, а также этот адрес должен быть указан во всех каталогах, где есть ваш сайт. Кроме того нужно решить, хотите ли вы слэш в конце или https (если на вашем сайте вводится специфическая информация, типа кредитных карт). Выберите один вариант и придерживайтесь его всегда. Если бы выбирать приходилось мне, я бы предпочел вариант, который используется чаще всего, чтоб снизить уровень головной боли, когда дело доходит до наведения порядка в URLах.

К счастью, если вы работаете с WordPress, большинство таких проблем решаются довольно просто. Мы расскажем вам о необходимых плагинах и действиях, которые нужно проделать далее в этой статье.

Но опять же повторюсь, что для канонических ссылок есть гораздо больше применений.

Дублированный контент, созданный таксономией

Скажем, вы написали статью и включили ее в разные категории блога и теги в WordPress (все это называется таксономией). Люди постоянно это делают. Или, например, есть у вас интернет-магазин, в котором товары заносятся в разные категории. Тогда, по замыслу, для удобства передвижения пользователей по сайту, один и тот же контент появляется по разным URL, но это приводит к появлению проблем. Например:

http://examplesite.com/store/candy/chocolate-truffles

http://examplesite.com/store/foods/chocolate-truffles

Вам хочется, чтоб посетители нашли эти самые «шоколадные трюфели» в обеих категориях: «сладости» и «еда». Неплохое стремление. Но на какой URL должны обращать внимание поисковые машины? Вы же помните, что они не будут ранжировать обе ссылки. Так что нужно выбрать. И вот здесь вам пригодятся канонические ссылки. Они скажут поисковым машинам «эй, на этой странице тот же контент, что и на той, пожалуйста, ранжируй эту страницу, а не ту».

Помните, что это просьба – ни одна поисковая система не обязана повиноваться вашей канонизации, и они могут ее проигнорировать, если посчитают неправильной.

Использование кроссдоменного канонического URL для дублированного контента

Это последняя причина, по которой вам нужен элемент канонический URL, который будет описан в данной статье (есть и другие, но они сложные, да и принцип использования не меняется): когда вы публикуете контент на вашем сайте, который также появляется и на других сайтах. Наиболее очевидные случаи такого дублирования – это пресс релизы. Так ваша компания публикует пресс релиз и размещает его на вашем сайте. Это вполне законно. Но, традиционно, пресс релиз – это такая штука, которую может опубликовать у себя кто угодно. Они создаются для того, чтоб ими делились и копировали. В этом заключается принцип работы сообществ дистрибьюторов, типа PRWeb . Это старый, как мир маркетинговый прием.

Но это рождает конфликт SEO интересов. Для поискового робота контент пресс релиза на вашем сайте – это то же самое, что и на сайтах его позаимствовавших. Так, где же оригинальная копия? Какую ссылку ранжировать в поисковой выдаче? Помните, что нужно выбрать только одну.

Обычно поисковые машины выбирают за вас, если только вы не предложите им свой вариант. И вы можете это сделать, использовав канонический URL. В случае пресс релизов, вы, как бы то ни было, вряд ли каждый новостной сайт будет публиковать вашу статью с каноническим URL на ваш ресурс. Помните, что для многих данный элемент не особо понятен. Я так же сомневаюсь, что кто-то будет тратить время на то, чтоб найти ресурс с исходной статьей и правильно кодировать свой HTML. Они публикуют по несколько статей в день, так что только вы можете позаботиться о правильных ссылках на вашем сайте. На вашем месте я бы поставил канонический URL на страницу, которая содержит пресс релиз, и обратился бы к копии, на странице крупного сообщества, где вы изначально разместили статью для заимствования. Например, закинем копию статьи на сайт PRweb.com (если вы используете данный сервис). Просто мои пять копеек.

Вот пример из реальной жизни, не связанный с ситуацией пресс релизов, где канонический URL пришелся весьма кстати: взгляните на статью, которую я написал о KISSmetrics около года назад:

Вскоре после этого Entrepreneur.com разместили эту статью у себя, так как у них было соглашение с KISSmetrics.

Вот URL той статьи:

http://www.entrepreneur.com/article/231237

Теперь у нас есть одинаковый контент, на который ведут две разные ссылки. Технически это дублированный контент, а дублированный контент – это «плохо», помните? Но не стоит бояться! Если вы посмотрите на исходный код Entreprenuer.com, то вы увидите это

Это говорит поисковым системам, где находится оригинальный контент, что представляет собой правильный выход из ситуации.

Это снимает подозрение в воровстве контента в глазах поисковых систем (которые не могут иначе узнать, кому именно принадлежат легальные права на публикацию контента).

Вероятно, вам бы не хотелось иметь такой сайт, на котором публикуются только чужие материалы. Тут элемент канонический URL, вряд ли поможет вам улучшить ранжирование сайта. Так что не злоупотребляйте использованием данной тактики.

Когда вы не можете использовать канонический URL для дублированного контента с другого сайта

Мне хочется осветить один момент, так как я много раз наблюдал такую ситуацию. Если вы собираетесь написать описание компании или персональную биографию на вашем сайте я бы не рекомендовал вам использовать тот же набор слов в ваших профилях в социальных сетях или на любых других сайтах. Если вы пишите одно и то же снова и снова на странице вашей компании на LinkedIn, бизнес странице на Google Plus и т. д., вы просто дублируете ваш контент. Вы не сможете использовать канонический URL на странице, посвященной компании или человеку, и сделать отсылку к профилю в социальной сети: вам не захочется чтоб такая страница ранжировалась сама по себе. В этом случае, пожалуйста, просто пишите каждый раз новое уникальное описание.

Как использовать канонические URLs в WordPress

Это можно сделать разными способами, но я расскажу вам о лучшем варианте, который мне известен: используйте плагин от Joost De Valk. Как только вы установите это расширение на вашем сайт, он начнет заботиться о вашем SEO, включая управление каноническими URL для того, что я назвал «скрытыми» URLами (смотри выше). Но все-таки стоит обратить внимание на некоторые настройки. На скрине ниже, виден экран настройки для единичной записи или страницы (так же применимо для пользовательских типов записей, если вы такие используете), и SEO-бокс WordPress содержит много полей и настроек. Для настройки канонических URL, которые пригодятся для штук типа пресс релизов и контента, дублированного на других сайтах, кликните таб “Advanced”:

Этот плагин значительно упростит для вас элемент канонический URL. Все, что нужно сделать, это ввести полный url оригинального источника вашего контента, который публикуется на данной странице. Другими словами, URL, который копирует контент, это та ссылка, которая должна использовать каноническую URL в HTML «шапки». Копированный контент теперь будет сигнализировать поисковикам о том, что он всего лишь копия. Имеет смысл, да?

Хорошо, но это всего лишь принцип. Исходя из примера, данного выше, вам может иногда захотеться указать, что вы всего лишь копируете контент, хотя это совсем не так, так как вам просто трудно контролировать распространение контента. Вы можете опубликовать пресс релиз на сайте своей компании и, если нужно, вы можете использовать атрибут для оригинального источника контента в сети синдикации, которую вы используете. В этом смысле вы будете действовать, как один из синдикаторов. (между прочим, это всего лишь мое мнение. Этот совет могут не одобрить другие SEO-эксперты. Так что используйте его на свой страх и риск. Google «клянется», что он очень хорош в идентификации оригинального источника контента, и канонические указатели – это только дополнительная подмога. Поисковые системы могут их проигнорировать).

В других случаях канонические URL, которые вы вводите, будут внутренними ссылками вашего сайта, содержащими дублированный контент. Скажем, например, вы публикуете описание вашего товара на статичной странице для оптовых покупателей. Но вы используете это же описание в разделе вашего сайта, где люди покупают товары в розницу.

Используя поле для канонического URL в SEO-настройках WordPress, вы можете подсказать поисковым машинам какую ссылку вы бы хотели, чтоб они ранжировали.

Замечание: Вам нужно выбрать версию ссылки с www или без www для каждой страницы, используя эти настройки. Плагин WordPress SEO делает это автоматически. Вам могут понадобиться эти настройки только в том случае, когда URL очень отличается или контент находится на другом домене.

Настройка https глобальной канонической URL с использованием WordPress SEO

Вот еще кое-что, что вы можете сделать с каноническими ссылками, используя плагин WordPress SEO. Если вы используете сертификаты SSL (для продаж в Интернете) вы можете сделать так, чтоб ваш канонический тег использовал https версию ваших ссылок в том случае, если страницы могут находиться и по http, и по https. Для этого идем в SEO > Permalinks и прокручиваем до «Canonical Settings» (канонические ссылки) в вашей консоли WordPress.

Кликаем на развернувшееся меню, где можно выбрать тип URL, который вы хотите сделать элементом canonical URL в теге всех ваших страниц:

Загрузка...