Référencement technique

Canonisation catastrophique

Depuis que Google a publié la balise canonique au début de 2009, nous avons entendu une histoire d’horreur SEO similaire se répéter. Cela se résume à ceci : “J’ai accidentellement canonisé l’intégralité de mon site sur une seule page, et mon site a été complètement supprimé de l’index.” Bien que les preuves que rel-canonical tourne très mal étaient accablantes, j’ai décidé qu’il était temps d’obtenir des données de première main dans le but d’aider les gens à la fois à éviter ce problème et potentiellement à le résoudre.

AttentionAvertissement! L’expérience SEO suivante a été menée par un professionnel qualifié (prétendument), et cela ne s’est pas avéré être une très bonne idée, même pour lui. Les enfants, n’essayez pas ça à la maison.

Présentation du test

Tout d’abord, tout au long de cet article, je ferai référence à la “balise canonique”, c’est-à-dire à la méta-directive et non à la canonisation en général. Le 23 août 2010, j’ai ajouté la balise canonique à l’échelle du site à mon blog d’utilisabilité. Chaque balise était identique, canonisant chaque page sur ma page d’accueil :

Autant que possible, je n’ai apporté aucune autre modification de contenu au cours de l’expérience. Chaque jour, j’ai mesuré le classement de quelques termes critiques ainsi que le nombre de pages indexées de Google (en utilisant l’opérateur “site :”).

Phase I – Le déclin

Le graphique ci-dessous montre les pages indexées depuis le jour où j’ai mis en place la balise canonique jusqu’au jour où je l’ai supprimée, un peu moins de 3 semaines plus tard :

Graphique de la baisse de l'indice

Malgré une augmentation à court terme des pages indexées, l’impact global a été énorme, même à relativement court terme. Le nombre total de pages indexées est passé de 237 à 103 (57 %). La ligne inférieure rouge clair indique le nombre de pages non supplémentaires (les pages avant d’atteindre les résultats omis). Je pensais que cela valait la peine d’être suivi, mais le schéma était très similaire. Bien que la canonisation puisse être utilisée pour supprimer le contenu en double, Google ne considère PAS qu’une page canonisée à tort est un doublon – la page est simplement supprimée de l’index.

Je vais discuter brièvement de certaines étapes importantes du déclin. Chaque jalon est marqué de la date et du nombre de jours écoulés après la mise en place du tag (ex : +1 = 1 jour après).

Jour +1 (24 août) – Avertissement canonique SEOmoz

Un peu plus d’un jour après avoir activé les balises canoniques, j’ai remarqué une poignée d’avertissements Rel-Canonical dans le gestionnaire de campagne SEOmoz sous l’onglet “Sur la page”. Si vous n’avez pas de balise canonique ou de balise auto-référençante, vous devriez voir ceci :

Capture d'écran du gestionnaire de campagne SEOmoz

Gardez à l’esprit qu’une case non cochée peut convenir – évidemment, certaines balises canoniques pointeront vers des URL différentes. Si vous commencez à voir cela en gros volumes, vous pourriez avoir un problème. Malheureusement, Google Webmaster Tools n’affiche aucune erreur de mauvaise canonisation.

Jour +3 (26 août) – Page d’accueil n° 1 désindexée

Bien que l’indexation ait en fait montré une bosse à cette époque, ma page la plus visitée, avec la première place sur Google pour une phrase solide de 2 mots, a été désindexée. Ma page d’accueil a pris sa place dans le classement pour cette phrase. Cela démontre un point critique. Avec de nombreux problèmes de référencement, les pages fortes sont un peu mises en mémoire tampon en raison de leur “autorité”, de leur profil de lien, etc. Dans ce cas, étant donné qu’une autorité élevée signifie une exploration plus fréquente, les premières pages de mon site ont été les premières affectées. Au moment où vous remarquez les dommages d’une mauvaise canonisation de l’ensemble du site, vos pages principales peuvent avoir été désindexées pendant des semaines.

Jour +12 (4 septembre) – Page d’accueil n° 2 désindexée

Un peu plus d’une semaine plus tard, j’ai remarqué que ma 2e page d’accueil avait disparu de l’index, également pour une phrase clé assez compétitive. Ma page d’accueil a pris sa place, mais malheureusement le classement est passé du #1 au #9. Malheureusement, je ne surveillais pas cette page depuis le début, elle a donc probablement été désindexée plus tôt.

Jour +19 (11 septembre) – Perte de trafic majeure

La désindexation en elle-même commençait à m’inquiéter à ce stade, en particulier pour les premières pages, mais à la 2e semaine, je commençais également à voir une perte importante de trafic de recherche :

Graphique de la baisse du trafic de recherche

Le graphique couvre 4 semaines, y compris la semaine précédant la canonisation. C’est à peu près à cette époque que j’ai perdu mon sang-froid et j’ai décidé que j’en avais assez. Alors, je me suis mis à inverser le processus.

Étape II – La “récupération”

Le 11 septembre, j’ai supprimé la balise canonique du site. J’ai continué à collecter des données jusqu’au 14 octobre. Voici le graphique des pages indexées de Google lors de la reprise :

Graphique de récupération d'indice

Il y a eu une augmentation assez rapide des pages indexées, suivie de quelques périodes de stabilisation. Le nombre total (149 le dernier jour) n’a jamais retrouvé le nombre d’indexation d’origine de 237, même après un mois complet, mais une partie de ce contenu peut avoir été dupliquée.

Malheureusement, alors que l’indexation semblait bondir au cours des premiers jours, retrouver le statut de mes meilleures pages a pris un peu plus de temps. Vous trouverez ci-dessous quelques jalons, mesurés à partir du jour où j’ai supprimé la balise canonique du site.

Jour +18 (29 septembre) – Plan du site XML resoumis

Pour les besoins de l’expérience, j’ai essayé de laisser la récupération se dérouler d’elle-même, mais après quelques semaines sans retrouver mes meilleures pages, j’ai commencé à avoir des démangeaisons. Ma première étape a été simple, en soumettant à nouveau mon sitemap XML via Google Webmaster Tools.

Jour +21 (2 octobre) – XML partiel resoumis

Sachant qu’une nouvelle soumission de base n’accomplirait probablement pas grand-chose, j’ai créé un 2e sitemap XML avec seulement mes 3 meilleures pages et je l’ai soumis séparément. Je n’avais pas de grands espoirs, mais j’ai pensé que j’essaierais de lancer les robots d’exploration.

Jour +24 (5 octobre) – Ajout de balises canoniques uniques

Étant donné que les pages les plus touchées étaient toutes des articles de blog, j’ai décidé de rajouter des balises canoniques, mais cette fois des balises appropriées pointant vers les bonnes pages individuelles. J’espérais qu’une bonne balise canonique pourrait compenser une mauvaise, ou au moins attirer l’attention des crawlers.

Jour +26 (7 octobre) – Demande de réexamen soumise

Enfin, presque 4 semaines après avoir retiré la balise canonique, je suis devenu un peu désespéré. J’ai soumis ma première demande de réexamen Google depuis un bon moment. J’en reparlerai un peu plus tard.

Jour +27 (8 octobre) – Haut de page #1 réindexé

Juste un jour après le dépôt de la demande de réexamen, ma page d’accueil a retrouvé sa place de numéro 1 et a viré la page d’accueil. Compte tenu du timing, je doute que cela ait quelque chose à voir avec la demande, mais les balises canoniques réimplémentées ont peut-être aidé.

Jour +28 (9 octobre) – Haut de page #2 réindexé

Le lendemain, ma page #2 a retrouvé son statut. C’était plus important d’une certaine manière – alors que la page n ° 1 venait d’être remplacée par la page d’accueil dans le classement, la page n ° 2 avait complètement disparu du classement. Non seulement la page a été réindexée, mais elle a immédiatement retrouvé sa position de classement. Après 4 semaines complètes, j’ai enfin vu un peu de lumière au bout du tunnel.

Étape III – La plaidoirie

Considérez ceci comme un épilogue (comme si ce message n’était pas déjà assez long). J’ai pensé que nos lecteurs apprécieraient de voir ma demande de réexamen. Si rien d’autre, c’est honnête:

J’ai fait quelque chose de mal. Disons cela au grand jour. Fin août, j’ai rel-canonicalisé mon site entier (www.usereffect.com) sur la page d’accueil. Voici la chose – je l’ai fait exprès. « Pourquoi as-tu fait exprès quelque chose d’aussi stupide ? vous pourriez demander. Assez juste.
Divulgation complète – J’écris pour un blog SEO bien connu (SEomoz.org). Pendant des mois, nous avons entendu des histoires d’horreur de personnes qui ont accidentellement re-canonique leur site sur une page. Le problème est qu’ils ne savaient généralement pas quand cela avait commencé (puisque c’était accidentel) et qu’ils n’avaient pas beaucoup de données. J’ai donc décidé d’en collectionner. Je n’essayais pas de jouer avec Google – je voulais juste obtenir de bonnes données pour les propriétaires d’entreprise afin de les aider à éviter une erreur coûteuse.
La bonne nouvelle est que mon expérience a été un franc succès. En 3 semaines, mon index Google a été coupé en deux et mes pages les plus importantes ont été remplacées dans les SERP par la page d’accueil. J’ai décidé d’avoir fait valoir mon point de vue et d’inverser les balises le 11 septembre (probablement pas le meilleur choix de dates, rétrospectivement).
Presque un mois plus tard, et certaines de mes pages clés ont toujours disparu de l’index. Ce sont des pages solides avec de bons profils de liens naturels. J’ai resoumis mon sitemap XML, soumis un sitemap ciblé avec uniquement ces pages et j’ai ajouté de nouveaux rel-canonicals auto-référençant ces pages. Jusqu’à présent rien.
Donc, aussi embarrassant soit-il, je n’ai pas d’autre choix que de vous demander pardon, les dieux de Google. Vous qui êtes puissants au sommet de votre Mountain View, chacun plus beau et plus brillant que le précédent, je vous en supplie – s’il vous plaît, regardez avec pitié ce simple mortel et accordez votre générosité sur les pages suivantes qui ont provoqué votre défaveur :
[short list of URLs]

Vôtre en toute humilité,
Dr Peter J. Meyers (“Dr Pete”)

Leçons apprises

Je pense que la leçon ici est assez simple – ne faites pas cela. Bien sûr, vous ne canoniquerez jamais l’intégralité de votre site sur une seule page, mais avec les en-têtes et les systèmes CMS actuels, il est incroyablement facile d’écrire une balise d’en-tête qui affecte l’ensemble de votre site, même sur des milliers de pages. Je ne dénigre pas la balise canonique en tant qu’outil – je pense qu’elle a des utilisations très stratégiques. Le problème est que c’est l’un de ces rares cas où vous pouvez effectivement détruire vos efforts de référencement en changeant une seule ligne de code.

Avec une seule balise de 57 caractères, j’ai perdu mon classement sur mes termes les plus compétitifs et j’ai réduit de plus de moitié mes pages indexées et mon trafic de recherche. La balise canonique est un outil puissant, mais utilisez-la judicieusement et planifiez soigneusement.

(Article traduit de moz.com)

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Index