Analyse du référencement

Une meilleure approche pour filtrer le spam Web dans Google Analytics

“Ne jetez pas le bébé avec l’eau du bain” est un dicton populaire qui existe depuis le 16ème siècle, mais qui n’en est pas moins pertinent aujourd’hui, surtout lorsqu’il est considéré dans le contexte du spam Web dans Google Analytics. En fait, les frustrations causées par le problème du spam ont entraîné la perte de données authentiques.

Le spam dans les analyses pourrait être la chose la plus irritante du marketing en ligne. De nombreux articles de blog ont été écrits sur le sujet.

Une solution particulière apparaît systématiquement comme le moyen le plus rapide de se débarrasser du spam : configurez un ou deux filtres dans vos analyses, et vous êtes définitivement débarrassé du spam. Cette stratégie consiste à n’inclure que des noms d’hôte valides pour filtrer les spammeurs fantômes, le type de spammeurs le plus agressif.

Même si la mise en œuvre de cette solution est une option apparemment valable, c’est aussi la plus risquée, car vous risquez de perdre des données et des informations précieuses au cours du processus.

Pourquoi cette option apparemment valide est-elle risquée ?

L’utilisation de l’option à deux filtres est risquée car elle utilise l’inclusion au lieu de l’exclusion ; et aussi parce qu’il marque un nom d’hôte non défini comme spam.

Inclusion contre exclusion

  • Inclusion : autorise uniquement les données provenant de sources authentiques connues
  • Exclusion : ne filtre que les données provenant de sources de spam connues

Qu’est-ce qu’un nom d’hôte ?

Le nom d’hôte vous indique toujours à partir de quel domaine votre site Web a été visité.

Il peut s’agir de n’importe quel (sous-)domaine que vous revendiquez, comme www.mondomaine.com, mondomaine.com, blog.mondomaine.com ou mondomaine.co.uk. Cependant, le nom d’hôte peut également être le domaine de services de traduction, de cache ou d’achat tels que translate.googleusercontent.com ou paypal.com.

Cette stratégie est parfaite pour être utilisée dans le vide. Dans la vraie vie, cependant, nous avons vu trop de cas où l’utilisation de cette stratégie aurait pu mal tourner :

  1. Sur une période de plusieurs mois ou années, vous travaillez avec plusieurs personnes et agences. Ils ne savent pas toujours ce qui a été mis en place auparavant.
  2. Internet et votre entreprise évolueront et des sources plus authentiques apparaîtront. Qui s’assurera qu’ils sont toujours inclus dès le premier jour ?
  3. De plus, une erreur technique mineure dans votre code peut faire en sorte que votre nom d’hôte ne soit “pas défini”. Cela ferait apparaître vos données authentiques comme spam. Cela ne passerait pas le filtre d’inclusion, et vous ne le sauriez même jamais.

Les données réelles ont besoin d’une solution concrète

Avec la stratégie d’inclusion, l’un des scénarios réels ci-dessus vous fait perdre des données authentiques.

En effet, un de nos clients aurait supprimé toutes les données de conversion de la marque s’il avait utilisé la solution à deux filtres, uniquement à cause d’un plug-in tiers mis en place par une autre agence.

Le plug-in a créé une nouvelle session sans les données du nom d’hôte au lieu de la session réelle :

AAAAAQAAAAAAAAV-AAAAJGEyOGRlNDcxLTRlMDgt

Quelle est la meilleure alternative ?

Ne filtrez les spams que lorsque vous êtes sûr à 100 % qu’il s’agit de spams. Travailler avec l’exclusion a ses inconvénients, bien sûr :

  1. Vous devez vous assurer que vos filtres d’exclusion sont toujours à jour avec les derniers spammeurs.
  2. Vous autoriserez l’entrée de certains spams, par exemple les visites avec un nom d’hôte non défini qui sont en fait des spammeurs.

D’après les données des comptes de nos clients, ces spammeurs représentent en moyenne 0,4 % de l’ensemble du trafic.

Cela signifie que vos analyses conserveraient en moyenne une précision de 99,6 sans risquer de perdre du trafic authentique.

Retour à toi

Alors, que pensez-vous de la gestion du spam dans l’analyse ?

Si vous êtes comme nous, vous préférez filtrer les vrais spams tout en réduisant la probabilité que de vraies données soient incluses.

(Article traduit de moz.com)

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Index