Moteurs de recherche

Audit de page manquante en 10 minutes

Certains d’entre vous savent que je passe beaucoup de temps dans les coulisses ici sur Pro Q&A. L’un des défis des questions-réponses est que nous devons souvent résoudre des problèmes complexes en très peu de temps – nous pouvons avoir 10 à 15 minutes pour résoudre un problème comme “Pourquoi ma page ne s’affiche-t-elle pas sur Google ?” sans accès aux données internes, au code côté serveur, etc.

Bien sûr, je ne vous suggérerais jamais d’essayer de résoudre vos propres problèmes de référencement en seulement 10 minutes, mais c’est incroyable ce que vous pouvez faire lorsque vous êtes obligé de vraiment faire en sorte que votre temps compte. J’aimerais partager mon processus de 10 minutes (plus ou moins) pour résoudre un problème de référencement courant – trouver une page “manquante”. Vous pouvez en fait l’appliquer à un certain nombre de problèmes, notamment :

  • Savoir pourquoi une page n’est pas indexée
  • Découvrir pourquoi une page n’est pas classée
  • Déterminer si une page a été pénalisée
  • Détecter les problèmes de contenu dupliqué

Je décomposerai les 10 minutes, minute par minute (plus ou moins). La mini-horloge sur chaque élément vous indique le temps écoulé, pour un drame en temps réel.

0:00-0:30 – Confirmer que le site est indexé

Commencez toujours par le début – votre page manque-t-elle vraiment ? Bien qu’il ait parfois mauvaise réputation en termes de précision (principalement, le nombre total de pages compte), Google placer: commande est toujours le meilleur outil pour le travail. Il est idéal pour les recherches approfondies, car vous pouvez le combiner avec des recherches par mots clés, des recherches par “mots clés” (correspondance exacte) et d’autres opérateurs (titre :, inurl :, etc.). Bien sûr, le format le plus basique est simplement :

Site Google : exemple

Pour ce travail particulier, utilisez toujours le domaine racine. Vous ne savez jamais quand Google indexe plusieurs sous-domaines (ou le mauvais sous-domaine), et cette information pourrait être utile plus tard. Bien sûr, pour l’instant, vous voulez juste voir que Google sait que vous existez.

0:30-1:00 – Confirmez que la page est ne pas indexé

En supposant que Google sait que votre site existe, il est temps de vérifier la page spécifique en question. Vous pouvez entrer un chemin complet derrière la commande site : ou utiliser une combinaison de placer: et inurl :

Site Google : exemple - URL complète

Si la page ne semble pas être sur le radar de Google, réduisez le problème en testant uniquement “/folder” et voyez si quelque chose au même niveau est indexé. Si la page n’est pas du tout indexée, vous pouvez ignorer l’étape suivante.

1:00-1:30 – Confirmez que la page est ne pas classement

Si la page est en cours d’indexation mais que vous ne parvenez pas à la trouver dans les SERP, extrayez un extrait de la balise TITLE et effectuez une recherche de correspondance exacte (entre guillemets) sur Google. Si vous ne le trouvez toujours pas, combinez un site :exemple.com avec votre page TITLE ou une partie de celle-ci. Si la page est indexée mais pas classée, vous pouvez probablement ignorer les deux prochaines étapes (sauter à 4:00).

1:30-2:00 – Vérifiez les mauvais Robots.txt

Pour l’instant, supposons que votre site soit partiellement indexé, mais que la page en question ne figure pas dans l’index. Bien que les mauvais fichiers Robots.txt soient, heureusement, de plus en plus rares, il vaut toujours la peine de jeter un coup d’œil rapide pour vous assurer que vous ne bloquez pas accidentellement les robots de recherche. Heureusement, le fichier est presque toujours à :

 http://www.example.com/robots.txt

Ce que vous recherchez est un code source qui ressemble à ceci :

Exemple de fichier Robots.txt

Il peut s’agir soit d’une directive bloquant tous les agents utilisateurs, soit d’un seul, comme Googlebot. De même, recherchez les directives qui interdisent le dossier ou la page spécifique en question.

2: 00-2: 30 – Vérifiez META Noindex

Un autre problème de blocage accidentel peut survenir avec une mauvaise directive META Noindex. Dans l’en-tête du code source HTML (entre et ), vous recherchez quelque chose comme ceci :

Exemple de META Noindex

Bien qu’il puisse sembler étrange que quelqu’un bloque une page qu’il souhaite clairement indexer, de mauvaises balises META et Rel=Canonical (voir ci-dessous) peuvent facilement être créées par une mauvaise configuration du CMS.

2:30-3:00 – Vérifier le mauvais Rel=Canonical

Celui-ci est un peu plus délicat. La balise Rel=Canonical est, en soi, souvent une bonne chose, aidant à canoniser efficacement les pages et à supprimer le contenu en double. La balise elle-même ressemble à ceci :

Exemple de balise canonique

Le problème survient lorsque vous canonisez trop étroitement. Supposons, par exemple, que chaque page de votre site ait une balise canonique avec l’URL “www.example.com” – Google prendrait cela comme une instruction pour réduire l’intégralité de votre index de recherche à une seule page.

Pourquoi voudriez-vous faire cela? Vous ne le feriez probablement pas exprès, mais il est facile pour un mauvais CMS ou un mauvais plug-in de se tromper. Même si ce n’est pas à l’échelle du site, il est facile de canoniser trop étroitement et de supprimer des pages importantes. C’est un problème qui semble s’aggraver.

3: 00-4: 00 – Vérifiez les mauvais en-têtes / redirections

Dans certains cas, une page peut renvoyer un mauvais en-tête, un code d’erreur (404, par exemple) ou une redirection mal structurée (301/302) qui empêche une indexation correcte. Vous aurez besoin d’un vérificateur d’en-tête pour cela – il y en a beaucoup de gratuits en ligne (essayez HTTP Web-Sniffer). Vous recherchez un code d’état “200 OK”. Si vous recevez une chaîne de redirections, un 404 ou tout autre code d’erreur (séries 4xx ou 5xx), vous pourriez avoir un problème. Si vous obtenez une redirection (301 ou 302), vous envoyez la page “manquante” vers une autre page. Il s’avère qu’il ne manque pas vraiment du tout.

16h00-17h00 – Vérifier la duplication entre sites

Il existe essentiellement deux catégories potentielles de contenu en double : les pages en double sur votre site et les doublons entre les sites. Ce dernier peut se produire en raison du partage de contenu avec vos propres propriétés, de la réorientation légale du contenu (comme le ferait un spécialiste du marketing affilié) ou du grattage total. Le problème est qu’une fois que Google détecte ces doublons, il va probablement en choisir un et ignorer le reste.

Si vous pensez que le contenu de votre page « manquante » a été extrait d’un autre site ou pris par un autre site, saisissez une phrase au son unique et recherchez-la sur Google avec des guillemets (pour faire une correspondance exacte). Si un autre site apparaît, votre page a peut-être été signalée comme doublon.

5:00-7:00 – Vérifier la duplication interne

La duplication interne se produit généralement lorsque Google explore plusieurs variantes d’URL pour la même page, telles que les paramètres CGI dans l’URL. Si Google atteint la même page par deux chemins d’URL, il voit deux pages distinctes, et l’une d’entre elles sera probablement ignorée. Parfois, c’est bien, mais d’autres fois, Google ignore le mauvais.

Pour la duplication interne, utilisez un placer: requête avec des mots-clés de titre uniques de la page (encore une fois, entre guillemets), soit de manière autonome, soit en utilisant titre :. Les doublons basés sur les URL ont naturellement des titres et des données META en double, de sorte que le titre de la page est l’un des endroits les plus faciles à trouver. Si vous voyez soit la même page apparaître plusieurs fois avec des URL différentes, soit une ou deux pages suivies de ceci :

Google a omis les résultats

… alors il est tout à fait possible que votre page manquante ait été filtrée en raison d’une duplication interne.

7:00-8:00 – Examen de la qualité du texte d’ancrage

Ces deux derniers sont un peu plus difficiles et plus subjectifs, mais je veux donner quelques conseils rapides pour savoir par où commencer si vous soupçonnez une pénalité ou une dévaluation spécifique à la page. Un problème assez facile à repérer est lorsque vous avez un modèle de texte d’ancrage suspect – généralement, une combinaison de mots clés peu commune qui domine vos liens entrants. Cela peut provenir d’une campagne de création de liens très agressive (et souvent de mauvaise qualité) ou de quelque chose comme un widget qui domine votre profil de lien.

Open Site Explorer vous permet de consulter assez facilement votre texte d’ancrage à grands traits. Entrez simplement votre URL, cliquez sur Distributions de texte d’ancrage (le 4e onglet) et sélectionnez Phrases:

Ouvrir l'onglet d'ancrage de l'explorateur de site

Ce que vous recherchez est un modèle de répétition non naturelle. Certaines répétitions sont acceptables – vous allez naturellement avoir un texte d’ancrage pour les mots-clés de votre nom de domaine et votre nom de marque exact, par exemple. Disons, cependant, que 70% de nos liens pointant vers SEOmoz avaient le texte d’ancrage “Danny Dover est génial”. Ce ne serait pas naturel. Si Google pense qu’il s’agit d’un signe de création de liens manipulatrice, vous pouvez voir cette page cible pénalisée.

8h00-10h00 – Examen de la qualité du profil de lien

La qualité du profil de lien peut être très subjective, et ce n’est pas une tâche à laquelle vous pouvez rendre justice en deux minutes, mais si vous avez une pénalité en jeu, il est parfois facile de repérer rapidement des liens louches. Encore une fois, je vais utiliser Open Site Explorer, et je vais sélectionner les options suivantes : Suivi + 301, Pages externes uniquement, Toutes les pages sur le domaine racine:

Ouvrir les pages de liaison de l'explorateur de site

Vous pouvez exporter les liens vers Excel si vous le souhaitez (idéal pour une analyse approfondie), mais pour l’instant, vérifiez simplement. S’il y a quelque chose de louche sur les deux premières pages, il y a de fortes chances que les liens les plus faibles soient en désordre. Cliquez sur quelques pages, en recherchant des problèmes tels que :

  • Texte d’ancrage suspect (non pertinent, spam, etc.)
  • Sites avec des sujets totalement hors de propos
  • Liens intégrés dans un bloc manifestement payé ou échangé
  • Liens faisant partie d’un pied de page à liens multiples
  • Liens publicitaires qui sont suivis (et ne devraient pas l’être)

Recherchez également toute dépendance excessive à un type de lien de mauvaise qualité (commentaires de blog, marketing d’articles, etc.). Bien qu’une analyse complète du profil de lien puisse prendre des heures, il est souvent étonnamment facile de repérer la création de liens indésirables en quelques minutes seulement. Si vous pouvez le repérer aussi rapidement, il y a de fortes chances que Google le puisse aussi.

(10:00) – Le temps est écoulé

Dix minutes peuvent sembler peu (il vous a peut-être fallu autant de temps pour lire cet article), mais une fois que vous avez mis en place un processus, vous pouvez en apprendre beaucoup sur un site en quelques minutes seulement. Bien sûr, trouver un problème et le résoudre sont deux choses totalement différentes, mais j’espère que cela vous donne au moins le début d’un processus pour vous essayer et affiner vos propres problèmes de référencement.

(Article traduit de moz.com)

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Index