Analytics

Le complot du schéma

UNE schéma est quelque chose que les plates-formes de traitement de données telles que Google Analytics appliquent aux données brutes sur les hits provenant de la source de données (généralement un site Web). L’aspect le plus visible du schéma de Google Analytics est la façon dont il regroupe, ou des points de sutureles données arbitraires au niveau des appels provenant du site Web sont discrètes séanceset ceux-ci sont en fait regroupés sous un autre compartiment agrégé : utilisateurs.

Mais vous le savez déjà. Vous examinez des métriques telles que les sessions, le taux de rebond, le taux de conversion, et vous les utilisez ou des variantes de celles-ci comme KPI dans vos tableaux de bord et ainsi de suite. Droite?

Jetez un œil au groupe de mesures ci-dessous :

Métriques sessionnalisées

Voici quelques-unes des mesures de référence que les gens utilisent pour attribuer sens au flux de données provenant du site Web. Le problème avec ces mesures, c’est qu’elles sont très fortement mis en session. Ils sont entièrement dépendants d’un schéma arbitraire, que beaucoup ne comprennent pas ou même ne remettent pas en question. Modifier la définition d’un session même un peu, et chacune de ces mesures aura une valeur différente.

Et c’est là que réside le problème que je surnomme maintenant le Complot de schéma. Je sais, je sais, c’est un peu dramatique. Mais les implications sont également dramatiques.

Lorsque vous utilisez Google Analytics ou toute plateforme de traitement de données appliquant un schéma, vous vous abonnez au schéma imposé par la plateforme. Vous n’avez pas votre mot à dire. Dans GA, vous pouvez apporter des modifications mineures à la définition d’une session à l’aide d’outils tels que Expiration de la session et Liste d’exclusion de références, mais il n’en reste pas moins que le schéma des sessions dans Google Analytics reste universel, générique et totalement arbitraire ; trois qualités qui ne devraient pas exister lors de l’utilisation des données pour optimiser la croissance de l’entreprise.

Expiration de session et exclusion de référence

Dans Google Analytics, une session peut être définie approximativement comme une expérience de navigation ininterrompue, qui expire après 30 minutes d’inactivité. Donc, vous entrez sur un site Web, vous y faites des choses et 30 minutes après la dernière interaction, la session expire. Naturellement, c’est plus complexe que cela, mais en tant que description approximative, cela devrait suffire.

Lectures complémentaires : définition d’une session dans Analytics

Maintenant, posez-vous la question : comment cela reflète-t-il tout ce qui se passe dans le monde réel ? Pas vraiment, non ? Le concept d’un session être fondé sur quelque chose de moins éphémère qu’une séquence complètement arbitraire de visites sur le site Web, combinée à un étrange et inexplicable délai d’attente de 30 minutes ?

Vous pourriez ne pas voir la pertinence de tout cela, et vous pourriez être entièrement satisfait du concept de session de Google Analytics, et vous y avez bien sûr droit.

Mais considérez le taux de conversion, par exemple. Le taux de conversion est le rapport des sessions avec une conversion à toutes les sessions. Séances, séances, séances. Si vous utilisez le taux de conversion comme indicateur de performance clé, vous devez réaliser que vous optimisez par rapport à une métrique complètement fictive.

Pensez-y comme ça. Vous pourriez avoir besoin de 14 sessions pour convertir lors de l’achat d’un nouveau bateau. Vous n’aurez peut-être besoin que de 6 sessions pour convertir lors de l’achat d’un nouvel ordinateur. Mais au final, vous n’êtes toujours qu’un seul utilisateur converti, quel que soit le nombre de sessions qu’il a fallu pour le faire. La clé ici est que vous aviez un singulier intention: pour acheter un bateau ou un nouvel ordinateur. Cette intention a duré plusieurs sessions, soulignant encore plus la déconnexion entre les sessions et le comportement.

Longueur du chemin jusqu'à la conversion

Je pense que c’est effectivement très problématique. Les entreprises optimisent par rapport à une métrique très superficielle et éphémère, et complètement indépendante de la intention du visiteur. Vous ne devriez pas être intéressé par le nombre de sessions converties, vous devriez être intéressé par l’augmentation du nombre de clients que vous avez, en comprenant l’intention et en la transformant en un achat.

Maintenant, je suis assez cynique pour voir la justification de cette sessionisation arbitraire : la granularité de l’attribution. C’est pourquoi un changement de source de campagne lance une nouvelle session, même si la session n’a pas encore expiré. Vos canaux publicitaires ont besoin de l’attribution pour des conversions réussies, c’est pourquoi cette logique de sessionisation a été affinée pour donner un bon, gros et gros chiffre pour vos mesures d’acquisition.

Ne vous méprenez pas, je pense qu’il est utile de voir tous les canaux qui ont transformé un utilisateur non converti en un nouveau client. Mais la réalité est que séances ne convertissez pas, les utilisateurs le font. L’attribution doit également être équilibrée entre les points de contact qui m’ont amené à réaliser une intention que j’avais. Suivre une annonce démarre une nouvelle session sur le site Web, mais mon intention peut être la même qu’avant. L’annonce a peut-être rendu l’intention plus ciblée, plus spécifique, mais je suis toujours un utilisateur unique sur le chemin de la conversion.

Surmonter le problème à portée de main

Vous n’avez pratiquement pas de chance si vous souhaitez appliquer votre propre schéma à vos données Google Analytics. Même si Google Analytics Premium dispose de données au niveau des appels via BigQuery, il est toujours mis en session. Les tables de données assemblent les données au niveau des hits dans des sessions avant que vous ne puissiez accéder aux données. Ceci, je pense, suce beaucoup de temps.

(METTRE À JOUR: consultez le commentaire de Carmen Mardiros et celui de Pedro Avila dans les commentaires de cet article pour trouver des solutions de contournement pour obtenir des données au niveau des appels via l’API et BigQuery.)

Je comprends pourquoi l’interface utilisateur affiche un ensemble de données mis en session, car l’application de votre propre schéma de mise en session complexe nécessiterait une quantité incroyable de puissance de traitement. Mais pourquoi ne pas fournir des données brutes via l’API ?

Donc, vous ne pouvez rien faire avec le schéma de GA. C’est comme ça. Vous ne pouvez même pas voir les données appropriées au niveau de l’utilisateur non plus, car elles sont également mises en session. Considérez le segment personnalisé suivant :

segment personnalisé pour les utilisateurs

Il semble qu’il devrait afficher les données de tous les utilisateurs qui ont effectué une conversion à un moment donné dans le passé, n’est-ce pas ? Droite. Et tort.

Le segment ci-dessus me montre une cohorte d’utilisateurs qui ont converti au cours de la période sélectionnée. Mais ce n’est pas ce qui devrait m’intéresser. Je devrais pouvoir segmenter entre visiteurs convertis et non convertis, quelle que soit la période !

Non, une dimension personnalisée définie par l’utilisateur n’aidera pas non plus, car si je regarde une période avant la conversion de l’utilisateur, cela me montrera l’utilisateur comme un non-convertisseur.

Des choses comme ça me rendent fou. Si j’avais accès à des données brutes au niveau des hits, et si je pouvais construire mon propre schéma d’assemblage en plus de cela, je serais en mesure de plier les aspects de traitement et de création de rapports de GA à ma guise, améliorant ainsi la qualité des données pour ma entreprise seule. C’est ce que mes tableaux de bord devraient afficher ! C’est ce qui devrait motiver mon entreprise !

Dernières pensées

Alors, qu’est-ce qu’un schéma parfait ? Il n’y a rien comme ça. Tout comme chaque entreprise est différente, chaque schéma doit également être différent.

Idéalement, le schéma devrait être une chose vivante, en constante évolution, car vos visiteurs sont des êtres vivants, en constante évolution. Un schéma intelligent refléterait cela, peut-être même en apprenant de manière autonome en cours de route.

Idéalement, le schéma ne se contenterait pas uniquement des données de votre site Web. Vos visiteurs sont multidimensionnels, donc le schéma doit également être multidimensionnel.

De manière optimale, le schéma vous permettrait d’optimiser par rapport à des métriques pertinentes pour votre entreprise, et pour votre entreprise uniquement. Vos visiteurs sont votre entreprise, donc le schéma doit également être optimisé pour les visiteurs.

Enfin, le schéma utilisé par Google Analytics est parfaitement bien. Ne l’interprétez pas comme quelque chose que ce n’est pas. La mise en sessions de Google Analytics fait ne pas reflètent le monde réel, la mesure du taux de conversion doit ne pas être un indicateur de l’état de votre entreprise, et des métriques complètement sessionnalisées comme le taux de rebond, la durée de la session, etc. devraient jamais être utilisés uniquement comme KPI.

Utiliser une seule métrique imparfaite en session comme KPI, c’est comme ne raconter que la chute d’une blague.

Lectures complémentaires : Avinash Kaushik – Excellente astuce d’analyse n° 26 : Chaque métrique critique devrait avoir un meilleur ami !

Il existe des outils qui comblent le fossé entre la Business Intelligence et l’analyse Web. Ils vous permettent de construire les interprétations de vos données brutes de la manière que vous choisissez. Cela demande cependant des efforts. Un schéma personnalisé nécessite que vous compreniez le comportement de votre public à un tout autre niveau.

Lectures complémentaires : Snowplow Analytics

Es-tu d’accord avec moi? Ou pensez-vous que je fais des montagnes avec des taupinières ? Je ne plaide pas pour un bouleversement du fonctionnement de ces outils, mais je milite très fortement pour la pensée critique.

Ainsi, la prochaine fois que vous utiliserez la mesure du taux de conversion de Google Analytics pour quoi que ce soit, faites une pause d’une seconde et réfléchissez à ce que cette mesure signifie pour votre entreprise. Essayez de trouver une phrase comme : “L’augmentation que nous constatons dans le taux de conversion signifie que notre entreprise est…”, puis terminez par ce que le changement du taux de conversion signifie pour votre entreprise.

Vous pourriez trouver que c’est assez difficile.

Source : www.simoahava.com

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Index