Référencement techniqueSEOSEO on-page

Nourrir le colibri : le balisage structuré n’est pas le seul moyen de parler à Google

J’avais l’habitude de rire à l’idée de l’optimisation Hummingbird.

Dans un récent sondage, Moz a demandé à presque
300 commerçants que Google a mis à jour a le plus affecté leur trafic. Penguin et Panda ont terminé premier et deuxième, suivis de Hummingbird dans un lointain troisième.

Quelle mise à jour de Google a eu le plus d'impact sur votre trafic Web ?

Sans surprise, car contrairement à Panda et Pingouin,
Hummingbird ne combat pas spécifiquement le spam Web.

Vous êtes-vous déjà demandé pourquoi Google a nommé certains algorithmes d’après des animaux noirs et blancs (c’est-à-dire un chapeau noir contre un chapeau blanc ?) Hummingbird est un algorithme plus large, et les colibris peuvent être de n’importe quelle couleur de l’arc-en-ciel.

Un aspect de Hummingbird concerne
meilleure compréhension de votre contenupas seulement des tactiques SEO spécifiques.

Colibri représente également un
étape évolutive dans la recherche basée sur les entités sur lequel Google travaille depuis des années et qui continuera d’évoluer. D’une certaine manière, l’optimisation de la recherche d’entités est optimisation pour la recherche elle-même.

De nombreux référenceurs limitent leur compréhension de la recherche d’entités à de vagues concepts de données structurées, Schema.org et Freebase. Ils tombent dans le piège de penser que la seule façon de participer à la révolution SEO des entités est de balisez votre code HTML avec des microdonnées schema.org complexes.

Pas vrai.

Ne vous méprenez pas; schema.org et les données structurées sont géniaux. Si vous pouvez implémenter des données structurées sur votre site Web, vous devriez le faire. Les données structurées sont précises, peuvent conduire à des extraits de recherche améliorés et aident les moteurs de recherche à comprendre votre contenu. Mais Schema.org et les vocabulaires de données structurées classiques présentent également des lacunes importantes :

  1. Les types de schéma sont limités. Les données structurées sont idéales pour personnes, des produits, des endroits, et événements, mais ceux-ci ne couvrent qu’une fraction de l’ensemble du contenu du Web. Nous sommes nombreux à baliser notre contenu à l’aide du schéma Article, mais cela est bien loin de décrire le des centaines des associations d’entités possibles dans le texte lui-même.
  2. Le balisage est difficile. De manière réaliste, dans un monde où il est parfois difficile d’amener les auteurs à écrire une balise de titre ou d’amener les ingénieurs à attacher un attribut alt à une image, la mise en œuvre de données structurées appropriées au code source HTML peut être une tâche ardue.
  3. L’adoption est faible. Une étude réalisée l’année dernière sur 2,4 milliards de pages Web a montré que moins de 25 % contenaient un balisage de données structurées. Une étude récente de SearchMetrics a montré encore moins d’adoption, avec seulement 0,3 % des sites Web sur plus de 50 millions de domaines utilisant Schema.org.

Cela représente un défi pour les moteurs de recherche, qui souhaitent comprendre les relations entre les entités à travers le
tout le web – pas simplement les pièces que nous choisissons de baliser.

En réalité, les moteurs de recherche ont travaillé pendant plus de 10 ans – depuis les débuts de Google – à extraire des entités de notre contenu sans pour autant l’utilisation d’un balisage complexe.

Comment les moteurs de recherche comprennent les relations sans balisage

Voici une explication simple d’un sujet complexe.

Les moteurs de recherche peuvent structurer votre contenu en utilisant le concept de triplets. Cela signifie organiser les mots-clés dans un cadre de matièreprédicatobjet.

Les frameworks de données structurées comme schema.org fonctionnent très bien car ils classent automatiquement les informations dans un triple format. Prenez cet exemple de Schema.org.

<div itemscope itemtype ="http://schema.org/Movie">    <h1 itemprop="name">Avatar</h1>    <span>Director: <span itemprop="director">James Cameron</span> (born August 16, 1954)</span>    <span itemprop="genre">Science fiction</span>    <a href="https://moz.com/blog/movies/avatar-theatrical-trailer.html" itemprop="trailer">Trailer</a>  </div><br>  

L’extraction des triplets de cet exemple de code donnerait :

Avatar (Film)A directeurJames Cameron

MatièrePrédicatObjet

Le défi est : Les moteurs de recherche peuvent-ils extraire ces informations pour plus de 90 % de votre contenu qui n’est pas balisé avec des données structurées ?

Oui, ils peuvent.

Triples, triples partout

Posez à Google une question comme qui est le président de Harvard ou combien d’astronautes ont marché sur la lune, et Google répondra souvent à partir d’une page en l’absence de données structurées.

Considérez cette requête pour la longueur idéale d’une balise de titre.

Google est capable d’extraire le sens sémantique de cette page même si les propriétés de “longueur” et sa valeur de 50-60 caractères
ne sont pas structuré à l’aide du balisage schema.org classique.

Matt Cutts a récemment révélé que Google utilise plus de 500 algorithmes. Cela signifie 500 algorithmes qui superposent, filtrent et interagissent de différentes manières. La preuve indique que Google a de nombreuses techniques d’extraire des données d’entité et de relation qui peuvent fonctionner indépendamment les unes des autres.

Quoi qu’il en soit, que vous soyez un maître de schema.org ou non, voici des conseils pour communiquer les signaux d’entité et de relation dans votre contenu.

1. Mots clés

Oui, de bons mots clés à l’ancienne.

Même sans balisage structuré, les moteurs de recherche ont la capacité de analyser les mots-clés dans leur structure respective.

Mais les mots-clés par eux-mêmes ne vont que si loin. Pour que cette méthode fonctionne, vos mots clés doivent être accompagnés des prédicats et objets. En d’autres termes, vos phrases alimentent les moteurs de recherche lorsqu’elles contiennent des informations détaillées avec des sujets et une organisation clairs.

Considérez cet exemple de relations extraites de notre page de balise de titre par AlchemyAPI :

Entités extraites via AlchemyAPI

Il est prouvé que Google travaille sur cette technologie depuis plus de 10 ans, depuis l’acquisition de la société Applied Semantics en 2003.

Pour une compréhension plus approfondie, Bill Slawski a écrit un excellent article sur la capacité de Google à extraire le sens des relations du texte, ainsi que les excellents conseils d’AJ Kohn sur l’optimisation du Knowledge Graph de Google.

2. Tableaux et éléments HTML

C’est le référencement de la vieille école que les gens oublient souvent aujourd’hui.

HTML (et HTML5), par défaut, fournissent structure aux pages Web que les moteurs de recherche peuvent extraire. En utilisant listes, les tables, et propre titresvous organisez votre contenu de manière logique pour les robots.

Dans l’exemple ci-dessous, la technologie permet aux moteurs de recherche d’extraire facilement une relation structurée sur le président américain John Adams dans ce tableau Wikipedia.

Le but n’est pas d’entrer dans le Knowledge Graph de Google (qui est exclusif à Wikipedia et Freebase). Au lieu de cela, l’objectif est de structurer votre contenu de manière à ce qu’il ait le plus de sens et que les relations entre les mots et les concepts soient claires.

Pour une exploration plus approfondie, Bill Slawski a une autre excellente rédaction explorant de nombreuses techniques différentes que les moteurs de recherche peuvent utiliser pour extraire des données structurées à partir de contenu HTML.

3. Entités et synonymes

Comment appelle-t-on le président des États-Unis ? Que diriez-vous:

  • Barack Obama
  • POTUS (président des États-Unis)
  • Commandant en chef
  • Le mari de Michelle Obama
  • Premier président afro-américain

En vérité, tous ces éléments s’appliquent à la même entité, même si les chercheurs les rechercheront de différentes manières. Si vous vouliez préciser de quoi parlait exactement votre contenu (de quel président ?), deux techniques courantes consisteraient à inclure :

  1. Synonymes du sujet : Nous voulons dire le président des États-Unis → Barack Obama → commandant en chef et → le mari de Michelle Obama
  2. Phrases concomitantes : Si nous parlons de Barack Obama, nous sommes plus susceptibles d’inclure des phrases comme Honolulu (son lieu de naissance), Harvard (son collège), 44e (il est le 44e président) et même Bo (son chien). Cela permet de spécifier exactement de quel président nous parlons et va bien au-delà du mot-clé individuel lui-même.

entités et synonymes pour le référencement

L’utilisation de synonymes et d’association d’entités présente également l’avantage de faire appel à une intention de recherche plus large. Une étude de cas récente de Cognitive SEO l’a démontré en montrant des gains significatifs après l’ajout de synonymes sémantiquement liés à leur contenu.

4. Texte d’ancrage et liens

Les liens sont le connecteur relationnel originel du web.

Bill Slawski (encore une fois, parce qu’il est un dieu du référencement) écrit sur une méthode que Google pourrait utiliser pour identifier les synonymes d’entités utilisant un texte d’ancrage. Il semble que Google utilise également le texte d’ancrage de manière beaucoup plus sophistiquée.

Lorsque vous consultez les résultats de la boîte de réponse de Google, vous trouvez presque toujours un texte d’ancrage riche en mots clés associés pointant vers l’URL référencée. Demandez à Google”Combien de personnes ont marché sur la lune ?” et vous verrez ces mots dans le texte d’ancrage qui pointe vers l’URL que Google affiche comme réponse.

Autres requêtes :

Texte d'ancrage de l'URL de la boîte de réponse de Google

Dans ces exemples et d’autres que j’ai recherchés, le texte d’ancrage correspondant était présent à chaque fois en plus des informations pertinentes et des mots-clés sur la page elle-même.

De plus, il semble y avoir une indication que le texte d’ancrage interne pourrait également influencer ces résultats.

C’est un autre argument pour éviter les textes d’ancrage génériques tels que “cliquez ici” et “site Web”. Un texte d’ancrage descriptif et clair, sans en faire trop, fournit une mine d’informations aux moteurs de recherche pour en extraire le sens.

5. Tirez parti de Google Local

Pour les propriétaires d’entreprises locales, le moyen le plus simple et peut-être le plus efficace d’établir des relations structurées consiste à utiliser Google Local. L’ensemble de l’interface ressemble à un tableau de bord de données structurées sans Schema.org.

Lorsque vous considérez toutes les données que vous pouvez télécharger à la fois dans Google+ et même Moz Local, les possibilités de cartographier vos données commerciales sont assez complètes au sens de la recherche locale.

Au cas où vous l’auriez manqué, la semaine dernière, Google a présenté My Business, ce qui facilite encore plus la gestion de vos listes.

6. Surligneur de données structurées Google

Parfois, les données structurées sont encore la voie à suivre.

Lorsque vous rencontrez des difficultés pour ajouter du balisage à votre code HTML, Google propose son outil Structured Data Highlighter. Cela vous permet d’indiquer à Google comment vos données doivent être structurées, sans ajouter de code.

L’outil utilise un type d’apprentissage automatique pour comprendre quel type de schéma s’applique à vos pages, jusqu’à des milliers à la fois. Aucune compétence particulière ou codage requis.

Surligneur de données structurées Google Webmaster

Bien que le Surligneur de données structurées soit à la fois simple et amusant, les inconvénients sont :

  1. Les données ne sont disponibles que pour Google. Les autres moteurs de recherche ne peuvent pas le voir.
  2. Les types de balisage sont limités à quelques grandes catégories principales (articles, événements, etc.)
  3. Si votre code HTML change même un peu, l’outil peut se casser.

Même s’il est simple, le surligneur de données structurées ne doit être utilisé que lorsqu’il est impossible d’ajouter un balisage réel à votre site. Ce n’est pas une substitution pour la vraie chose.

7. Plugins

Pour le balisage schema.org pur, selon le CMS que vous utilisez, il existe souvent une multitude de plugins pour vous faciliter la tâche.

Si vous êtes un utilisateur de Wordpress, vos options sont nombreuses :

  • Plusieurs plugins SEO de Yoast
  • Extraits enrichis Schema.org tout en un
  • Créateur de schémas par Raven
  • Ajouter une balise méta

Avoir hâte de

Si vous avez la possibilité d’ajouter Schema.org (ou toute autre donnée structurée à votre site), cela vous aidera à gagner ces améliorations SERP convoitées qui peuvent contribuer au taux de clics et aider les moteurs de recherche à mieux comprendre votre contenu.

Cela dit, la compréhension sémantique du Web va bien au-delà des extraits enrichis. Aider les moteurs de recherche à mieux comprendre tout votre contenu est le travail du SEO. Même sans Hummingbird, c’est exactement le genre de choses que nous voulons faire.

Ce n’est pas “créez du contenu et laissez les moteurs de recherche le découvrir.” Son “créer un excellent contenu avec des indices et des signaux appropriés pour aider les moteurs de recherche s’en rendent compte.”

Si vous faites ce dernier, vous êtes loin devant dans le jeu.

(Article traduit de moz.com)

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Index