Guide complet de Rel Canonical – Comment et pourquoi (pas)

Voir également:
• Balises canoniques – Meilleures pratiques
• Meilleures pratiques SEO pour les URL canoniques + la balise Rel=Canonical
• Les 301, les 302 et les canoniques ne sont-ils pas fondamentalement les mêmes ?


Il existe de nombreux articles et ressources intéressants sur la balise canonique rel, mais ils peuvent être difficiles à identifier avec une simple recherche. Même si vous sortez du lot et trouvez quelque chose de vraiment utile, les informations actuelles peuvent être difficiles à séparer des anciennes. Il manque au Web une ressource actuelle de haut en bas sur la balise canonique rel. Dans cet article, je ferai de mon mieux pour tout couvrir et vous tenir au courant

le dernier.

Découvrez pourquoi et comment utiliser la balise canonique rel, quand ne pas l’utiliser, les différentes opinions des référenceurs expérimentés et d’autres éléments que vous devez savoir pour l’utiliser correctement.

Commençons par les bases, puis nous aborderons des idées et des problèmes plus avancés.

Quelle est la balise canonique ?

Tout d’abord, nous n’arrivons pas à nous mettre d’accord sur comment l’appeler. Soyez assuré que ‘rel canonical’, ‘rel=canonical’, ‘rel canonical tag’, ‘canonical URL tag’, ‘link canonic tag’ et simplement ‘canonical tag’ font tous référence à la même chose.

La balise canonique est une balise méta au niveau de la page qui est placée dans l’en-tête HTML d’une page Web. Il indique aux moteurs de recherche quelle URL est la version canonique de la page affichée. Son but est de garder le contenu en double hors de l’index des moteurs de recherche tout en consolidant la force de votre page en une seule page “canonique”.

Comment la balise canonique est-elle utilisée ?

La balise canonique est une solution relativement rapide pour résoudre le contenu dupliqué. Si votre site Web génère et affiche le même contenu (ou un contenu très similaire) sur plusieurs URL, la balise canonique peut être utilisée pour les regrouper et attribuer une version principale (canonique). Examinons une liste d’URL de contenu en double courantes.

  • http://example.com/quality-wrenches.htm (la page principale)
  • http://www.example.com/quality-wrenches.htm (oups ! toutes les pages se résolvent également avec le sous-domaine www)
  • http://example.com/quality-wrenches.htm?ref=crazy-… (cela ressemble à un moyen de suivre les sources de référence)
  • http://example.com/quality-wrenches.htm?sort=price (comment les utilisateurs voient les produits du prix le plus bas au plus élevé)
  • http://example.com/quality-wrenches.htm/print (la version imprimée légère sans publicité et graphique)

Une balise canonique faisant référence à la page principale, http://example.com/quality-wrenches.htm, pourrait être placée dans l’en-tête de toutes les pages ci-dessus.

Comment est-il mis en œuvre ?

La balise canonique fait partie de l’en-tête HTML d’une page Web. C’est au même endroit que nous mettons d’autres éléments SEO amusants comme la balise de titre, la balise de méta description et la balise de robots. Le code, comme dans mon exemple ci-dessus, ressemblerait à ceci.

Oh regarde, en voici un en action !

Source : CNN

Facile, non ?! Les entreprises avec des cycles de développement coûteux adorent la solution de balise canonique car elle peut être mise en œuvre relativement facilement. Il s’agit souvent d’un projet de développement simple au lieu de dizaines de projets plus compliqués.

Tout cela est très excitant, je sais, mais il y a certaines choses que vous devez savoir.

Il existe généralement une meilleure solution

La balise canonique ne remplace pas une architecture de site solide qui ne crée pas de contenu dupliqué en premier lieu. Il existe presque toujours une solution supérieure à la balise canonique du point de vue des meilleures pratiques SEO pures.

Passons en revue certains des exemples d’URL que j’ai fournis ci-dessus, cette fois nous parlerons de la façon de les corriger sans pour autant la balise canonique.

Exemple 1 : http://www.example.com/quality-wrenches.htm

Il s’agit d’une version en double car notre exemple de site Web résout à la fois la version www et la version non www. Si la balise canonique était utilisée pour extraire la version www de l’index (en gardant la version non-www comme version canonique), les deux versions seraient toujours résolues dans le navigateur. Les deux versions étant toujours en cours de résolution, les deux versions peuvent toujours continuer à générer des liens.

Une balise canonique, comme une redirection 301, ne transmet pas toute la valeur du lien d’une page à l’autre. Il en passe la plupart, mais pas tous. Nous estimons que la perte de valeur de lien avec l’une ou l’autre de ces solutions est de 1 à 10 %. De cette façon, une redirection 301 et une balise canonique sont identiques.

Je recommanderais une redirection 301 au lieu d’une balise canonique.

Pourquoi demandes-tu? Une redirection 301 prend une fois la perte de valeur du lien atteinte. Une fois qu’un 301 est en place, un utilisateur n’atterrit jamais sur la version URL en double. Ils sont redirigés vers la version canonique. S’ils décident de créer un lien vers la page, ils fourniront ce lien vers la version canonique. Aucun lien d’amour perdu. Comparez cela à la solution de balise canonique qui maintient la résolution des deux URL et perpétue la perte de valeur du lien.

Exemple 2 : http://example.com/quality-wrenches.htm?ref=crazy-…

Je comprends. Vous voulez savoir s’il valait la peine d’envoyer un échantillon de clé à la dame folle du blog pour examen. Que se passe-t-il lorsqu’un autre blogueur clique sur son lien, puis publie son propre article sur vos produits EN UTILISANT LA MÊME URL ? Votre astuce de suivi fantaisiste n’est plus aussi efficace, n’est-ce pas ?

Vous feriez mieux d’enregistrer cette référence, puis de faire une redirection 301 vers la version de l’URL canonique. D’autres internautes créeront un lien vers l’URL appropriée et la partageront, et vous ne perdrez pas 1 à 10 % de votre amour de lien durement gagné sur une base continue.

Exemple 3 : http://example.com/quality-wrenches.htm?sort=price

Des URL comme celles-ci se produisent lorsqu’une page Web permet à l’utilisateur de trier les résultats de recherche en fonction de divers éléments, tels que le prix. Pour les besoins de cet exemple, je vais supposer que cette page de résultats de recherche ressemble plus à une page de destination de haute qualité avec certains résultats de recherche intégrés. De cette façon, je n’ai pas à entrer dans tout le problème des “résultats de recherche dans les résultats de recherche”. 🙂

Plutôt que d’utiliser la balise canonique ici, j’utiliserais la balise ‘noindex’ des méta-robots (ce qui signifie en réalité ‘noindex, follow’ car follow est implicite par défaut). Cela permet aux moteurs de recherche d’accéder en priorité à certaines des pages les plus importantes liées à celle-ci. En utilisant la balise méta des robots ‘noindex’, la page restera en dehors de l’index de recherche, mais toute valeur de lien sera transmise aux pages liées à celle-ci.

Exemple 4 : http://example.com/quality-wrenches.htm/print

Si les pages imprimées de votre site Web incluent un lien vers la page d’origine, vous pouvez également utiliser la balise “noindex” des méta-robots ici. La page reste en dehors de l’index et toute valeur de lien sera renvoyée à la version Web canonique d’origine de la page.

Vous voyez comment cela fonctionne ? Je vous mets au défi de me remettre tout scénario de contenu dupliqué et je serai en mesure de vous trouver une solution qui soit meilleure pour votre programme de référencement, du moins du point de vue des meilleures pratiques de référencement pur, que la balise canonique.

Je sais juste que quelqu’un va faire apparaître le fichier robots.txt comme solution de contenu en double. Avant de le faire, rappelez-vous que le fichier robots.txt est destiné à bloquer certaines pages ou répertoires de l’indexation des moteurs de recherche. Il ne consolide pas le jus de lien, crée essentiellement une impasse. Avant même de penser à utiliser le fichier robots.txt pour autre chose qu’un point vers votre sitemap XML, vous devriez consulter mon récent article sur le sujet, Serious Robots.txt Misuse & High Impact Solutions.

Vous voulez toujours utiliser la balise canonique, pour des raisons autres que le référencement pur ? Peut-être que votre service informatique n’est pas assis sur ses pouces en attendant votre prochain projet de référencement massif ?

Un mot, ou deux, de prudence

1. La prise en charge des moteurs de recherche est inégale, au mieux

Le niveau de prise en charge des moteurs de recherche pour la balise canonique varie considérablement. Google le prend en charge sur des domaines uniques et sur plusieurs domaines. Bing considère la balise canonique comme un “indice” et je n’ai entendu parler d’aucune implémentation de balise canonique ayant eu un impact sur l’index Bing. Avez-vous? Il doit sûrement y en avoir un…

2. Il existe de meilleurs correctifs de contenu en double

Corriger les systèmes qui génèrent du contenu dupliqué en premier lieu est la meilleure solution. Si ce n’est pas possible, recherchez plutôt d’autres solutions comme les redirections 301 et la balise meta noindex.

3. Une mise en œuvre incorrecte peut être un désastre

Si vous envisagez d’implémenter la balise canonique rel, assurez-vous qu’elle est correcte avant de lancer. Jetez un œil au récent article du Dr Pete, Catastrophic Canonicalization, pour en savoir plus sur son test. Tous les sites Web n’ont pas autant de chance que le Dr Pete dans leur rétablissement après l’échec de la mise en œuvre d’une balise canonique. Nous en voyons tout le temps des exemples dans les questions-réponses.

Voici quelques messages en faveur de l’orientation claire.

  • Pourquoi je déteste toujours Rel Canonical de Ian Laurie
  • La balise canonique de Stephan Spencer n’est pas encore fiable
  • Le lien canonique d’Adam Audette est en train de casser des sites

Et maintenant?

La balise canonique rel a sa place. C’est un gain de temps important pour le développement. La solution n’est pas aussi solide que certaines de vos autres options, mais si cela signifie pouvoir agir maintenant pour lutter contre le contenu en double au lieu d’attendre jusqu’en 2014, vous devriez y aller. Dans d’autres cas, votre solution d’hébergement peut ne pas vous permettre d’implémenter des redirections 301 et vos mains sont liées.

Si vous suivez la voie de la rel canonique, soyez prudent avec elle ! Testez, testez, testez. Si vous avez le choix et les ressources nécessaires pour trouver une solution plus efficace, vous devriez peut-être plutôt emprunter cette voie.

Plus de lecture

Si vous n’en avez pas assez sur la balise canonique rel pendant une journée, consultez ces liens utiles. Comme toujours, surveillez les dates sur ceux-ci!

  • Balise d’URL canonique – L’avancée la plus importante dans les pratiques de référencement depuis les plans de site, Rand Fishkin.
  • Conseils SEO – URL canonique, Matt Cutts
  • Spécifiez votre blog Canonical, Webmaster Central
  • À propos de rel=”canonical”, Matt Cutts
  • Google, Yahoo et Microsoft s’unissent sur une “balise canonique” pour réduire l’encombrement du contenu en double, Vanessa Fox
  • En savoir plus sur l’élément de lien canonique en 5 minutes, Matt Cutts

Bonne optimisation !

PS Keyphraseology, mon entreprise de conseil en référencement, recherche une bonne cause pour aider avec un audit de site pro bono et quelques heures de conseil. Si vous êtes une organisation à but non lucratif qui pourrait avoir besoin d’aide pour votre visibilité dans les moteurs de recherche, postulez ici.

image du type point d’interrogation fournie par Shutterstock

(Article traduit de moz.com)
Quitter la version mobile