Moteurs de rechercheSEO

Pouvons-nous prédire la météo de Google ?

[Estimated read time: 7 minutes]

Il y a quatre ans, quelques semaines seulement avant la première mise à jour de Penguin, le projet MozCast a commencé à collecter ses premières données réelles. Détecter et interpréter les mises à jour de l’algorithme de Google a été à la fois un défi beaucoup plus difficile et beaucoup plus gratifiant que ce à quoi je m’attendais, et j’ai beaucoup appris en cours de route, mais il y a une question lancinante à laquelle je n’ai jamais pu répondre avec aucun la satisfaction. Pouvons-nous utiliser les anciennes données de Google pour prévoir les futures mises à jour ?

Avant toute analyse, j’ai toujours été fan d’utiliser mes yeux. À quoi ressemble la “météo” de l’algorithme de Google sur une longue période ? Voici une année complète de températures MozCast :

La plupart d’entre nous savent maintenant que Google n’est pas une machine silencieuse qui bourdonne jusqu’à ce que la mise à jour nommée occasionnelle se produise quelques fois par an. L’algorithme change constamment et, même s’il ne l’était pas, le Web change constamment autour de lui. Trouver le signal dans le bruit est déjà assez difficile, mais qu’est-ce que tout pic ou vallée de ce graphique vous dit sur le moment où le prochain pic pourrait arriver ? Très peu, à première vue.

C’est quand même pire que ça

Avant même de plonger dans les données, il y a un problème fondamental à essayer de prédire les futures mises à jour de l’algorithme. Pour le comprendre, examinons un problème différent : prédire la météo dans le monde réel. Prévoir la météo dans le monde réel est incroyablement difficile et nécessite une énorme quantité de données pour bien faire, mais nous savons que cette météo suit un ensemble de lois naturelles. En fin de compte, quelle que soit la complexité du problème, il existe une chaîne de causalité entre le temps d’aujourd’hui et celui de demain et un modèle dans le chaos.

L’algorithme de Google est construit par des personnes, motivé par des motivations humaines et politiques, et n’est limité que par les règles de ce qui est technologiquement possible. Certes, Google ne remplacera pas l’intégralité du SERP par une image d’un sandwich au fromage demain, mais ils peuvent mettre à jour l’algorithme à tout moment, pour n’importe quelle raison. Il n’y a pas de lois naturelles qui lient l’algorithme de demain à celui d’aujourd’hui. L’histoire peut nous renseigner sur les motivations de Google et nous pouvons faire des prédictions raisonnables sur l’avenir de l’algorithme, mais ces futures mises à jour de l’algorithme ne sont pas nécessairement liées à un modèle ou à un calendrier.

Que savons-nous réellement ?

Si nous faisons confiance aux déclarations publiques de Google, nous savons qu’il existe de nombreuses mises à jour d’algorithmes. Le fait que seule une poignée soit nommée fait partie des raisons pour lesquelles nous avons construit MozCast en premier lieu. En 2011, Eric Schmidt a témoigné devant le Congrès, et son témoignage écrit comprenait les données suivantes :

Pour vous donner une idée de l’ampleur des changements envisagés par Google, en 2010, nous avons effectué 13 311 évaluations de précision pour déterminer si les changements d’algorithme proposés amélioraient la qualité de ses résultats de recherche, 8 157 expériences côte à côte dans lesquelles il a présenté deux ensembles de critères de recherche. résultats à un panel de testeurs humains et les évaluateurs ont classé quel ensemble de résultats était le meilleur, et 2 800 évaluations de clics pour voir comment un petit échantillon d’utilisateurs réels de Google ont réagi au changement. En fin de compte, le processus a abouti à 516 changements qui ont été jugées utiles aux utilisateurs sur la base des données et, par conséquent, ont été apportées à l’algorithme de Google.

J’ai mis en évidence une phrase – “516 modifications”. À une époque où nous pensions que Google effectuait peut-être une douzaine de mises à jour par an, Schmidt a révélé que c’était plus proche de 10X/semaine. Maintenant, nous ne savons pas comment Google définit les “changements”, et nombre de ces changements étaient sans aucun doute minimes, mais il est clair que Google change constamment.

La page How Search Works de Google révèle qu’en 2012, ils ont apporté 665 “améliorations” ou “lancements” sur la base d’un nombre incroyable de 118 812 évaluations de précision. En août 2014, Amit Singhal a déclaré sur Google+ qu’ils avaient apporté “plus de 890 améliorations à la recherche Google l’année dernière seulement”. Il n’est pas clair si cela faisait référence aux 12 mois précédents ou à l’année civile 2013.

Nous n’avons pas de chiffres publics pour les deux dernières années, mais il est incroyablement peu probable que le rythme du changement ait ralenti. Google apporte des modifications à la recherche de l’ordre de 2X/jour.

Bien sûr, toute personne ayant de l’expérience dans le développement de logiciels se rend compte que Google n’a pas réparti équitablement 890 améliorations au cours de l’année et en a publié une toutes les 9 heures et 51 minutes. Ce serait irréalisable pour de nombreuses raisons. Il est très probable que les versions soient déployées par blocs et soient liées à une sorte de processus ou de calendrier interne. Ce processus ou ce calendrier peut être irrégulier, mais les humains de Google doivent approuver, publier et auditer chaque modification.

En mars 2012, Google a publié une vidéo de sa réunion hebdomadaire sur la qualité de la recherche, qui, à l’époque, avait lieu “presque tous les jeudis”. Cette vidéo et d’autres déclarations depuis révèlent un processus systématique au sein de Google par lequel les mises à jour sont examinées et approuvées. Il n’est pas nécessaire de faire des calculs très avancés pour voir qu’il y a beaucoup plus de mises à jour par an qu’il n’y a de réunions hebdomadaires.

Existe-t-il un rythme hebdomadaire ?

Peut-être que nous ne pouvons pas prédire la date exacte de la prochaine mise à jour, mais y a-t-il une quelconque régularité dans le modèle ? Certes, c’est un peu difficile à dire à partir du graphique au début de ce post. L’analyse d’une série chronologique irrégulière (où la période entre les pics et l’intensité de ces pics changent) nécessite des calculs très délicats, j’ai donc décidé de commencer un peu plus simplement.

J’ai commencé par supposer qu’un motif régulier était présent et j’ai cherché un moyen de supprimer une partie du bruit sur la base de cette hypothèse. L’analyse la plus simple qui a donné des résultats consistait à prendre une moyenne mobile sur 3 jours et à calculer l’erreur standard moyenne (MSE). En d’autres termes, pour chaque température (chaque température correspond à un seul jour), prenez la moyenne de ce jour et du jour de chaque côté (une fenêtre de 3 jours) et mettez au carré la différence entre la température de ce jour et celle de 3 jours. moyenne. Cela exagère les pics autonomes et lisse certaines des séquences les plus bruyantes, ce qui donne le graphique suivant :

Ce message a été inspiré en partie par février 2016, qui a montré un rapport signal sur bruit inhabituellement élevé. Faisons donc un zoom sur les 90 derniers jours du graphique :

Voir les pics 2 à 6 (à partir du 21 janvier) ? L’espace entre eux est respectivement de 6 jours, 7 jours, 7 jours et 8 jours. Ensuite, il y a un écart de 2 semaines avec le prochain pic plus petit (3 mars) et encore 8 jours avec celui qui suit. Bien que cela ne soit guère la preuve d’un schéma régulier clair, il est difficile de croire que le rythme hebdomadaire est entièrement une coïncidence, compte tenu de ce que nous savons du processus d’approbation de la mise à jour de l’algorithme.

Cette tendance est moins claire les autres mois, et je ne dis pas qu’un cycle de mise à jour hebdomadaire est l’ensemble du tableau. Nous savons que Google effectue également de grandes actualisations de données (y compris Penguin) et déploie parfois des mises à jour sur plusieurs jours (voire semaines). Il y a un schéma similaire, bien que plus bruyant, en avril 2015 (la première partie du graphique MSE sur 12 mois). Il est également intéressant de noter les niveaux d’activité autour de Noël 2015 :

Malgré toutes nos théories du complot, il semble vraiment y avoir une accalmie de Noël 2015 dans l’activité de Google, d’une durée d’environ 4 semaines, suivie d’un pic assez important qui peut refléter des mises à jour de rattrapage. Les ingénieurs aussi partent en vacances. Notez que ce premier pic de janvier est suivi d’un écart d’environ 2 semaines, puis de deux écarts d’une semaine.

Le jour de la semaine le plus fréquent pour ces pics semble être le mercredi, ce qui est étrange, si nous pensons qu’il existe un lien avec les réunions du jeudi de Google. Il est possible que ces cycles approximativement hebdomadaires soient liés à des modèles de recherche naturels en milieu de semaine, bien que nous nous attendions généralement à des pics moins prononcés si le changement était lié à quelque chose comme des pics de trafic en milieu de semaine ou le volume de nouvelles.

Avons-nous déjà gagné Google ?

J’ai longuement expliqué pourquoi je pense que les mises à jour d’algorithmes sont toujours importantes, mais, tactiquement parlant, je ne pense pas que nous devrions essayer de planifier nos efforts autour de mises à jour hebdomadaires. De nombreuses mises à jour sont très petites et même certaines qui sont importantes en moyenne peuvent ne pas affecter notre employeur ou nos clients.

Je considère la météo de Google comme un peu comme le taux de chômage. C’est intéressant de savoir si ce taux est, disons, de 5 % ou de 7 %, mais en fin de compte, ce qui compte pour vous, c’est de savoir si vous avez un emploi ou non. Un taux de chômage faible ou élevé est un indicateur économique utile et peut vous aider à décider si vous risquez de trouver un nouvel emploi, mais il ne détermine pas votre sort. De même, mesurer la température de l’algorithme peut nous apprendre quelque chose sur le système dans son ensemble, mais la température d’un jour donné ne décide pas de votre succès ou de votre échec.

En fin de compte, au lieu d’essayer de prédire quand une mise à jour d’algorithme se produira, nous devrions nous concentrer sur les motivations derrière ces mises à jour et ce qu’elles signalent sur l’intention de Google. Nous ne savons pas exactement quand le marteau tombera, mais nous pouvons nous écarter du chemin à temps si nous y prêtons attention.

(Article traduit de moz.com)

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Index