Fermer

février 26, 2021

Comment écrire et tester des filtres Regex pour Google Analytics (avec des exemples)


Temps de lecture: 3 minutes

Comme pour beaucoup de mes articles ici, je fais quelques recherches pour un client et j'écris à ce sujet ici. Pour être honnête, il y a deux raisons pour lesquelles… La première est que j'ai une mémoire terrible et que je recherche souvent mon propre site Web pour obtenir des informations. Deuxièmement, aider les autres qui peuvent également rechercher des informations.

Qu'est-ce qu'une expression régulière (Regex)?

Regex est une méthode de développement pour rechercher et identifier un modèle de caractères dans le texte pour faire correspondre ou remplacer le texte. Tous les langages de programmation modernes supportent les expressions régulières.

J'adore les expressions régulières ( regex ) mais elles peuvent être un peu frustrantes ou exaspérantes à apprendre et à tester. Google Analytics a des capacités étonnantes… où vous pouvez créer des vues avec des expressions régulières ou filtrer vos données dans des expressions régulières.

Par exemple, si je voulais voir uniquement le trafic sur mes pages de balises, je pourrais filtrer pour / tag / in ma structure de permalien en utilisant:

 / tag  / 

La syntaxe est critique ici. Si je n'utilisais que «tag», j'obtiendrais toutes les pages contenant le terme tag. Si j'utilisais "/ tag", toute URL commençant par tag serait incluse, comme / tag-management car Google Analytics inclut par défaut tout caractère après l'expression régulière. Donc, je dois m'assurer que la barre oblique suivante est incluse… mais elle doit avoir un caractère d'échappement dessus.

 page filter regex

Regex Syntax Basics

Syntax Description
^ Commence par
$ Se termine par
. Un caractère générique pour n'importe quel caractère
* Zéro ou plus de l'élément précédent
. * Correspond à tous les caractères de
? Zéro ou une fois de l'élément précédent
+ Une ou plusieurs fois de l'élément précédent
| L'opérateur OR
[abc] A ou b ou c (peut être n'importe quel nombre de caractères)
[a-z] Intervalle de a à z (peut être n'importe quel nombre de caractères)
[A-Z] Plage de A à Z (majuscule)
[0-9] Plage de 0 à 9 (peut être n'importe quel nombre)
[a-zA-Z] Plage de a à Z ou A à Z
[a-zA-Z0-9] Tous les caractères alphanumériques
{1} [19659015] Exactement 1 instance (peut être n'importe quel nombre)
{1-4} Plage de 1 à 4 instances (peut être n'importe quel nombre)
{1,} 1 instance ou plus (peut être un nombre quelconque)
() Regroupez vos règles
Caractères spéciaux d'échappement
d Caractère numérique
D Caractère non numérique
s Espace blanc
S Espace non blanc
w Word
W Non-word (ponctuation)

Exemples de regex pour Google Analytics

Mettons donc quelques exemples là-bas pour certains Filtres personnalisés . Un de mes collègues m'a demandé de l'aide pour identifier une page interne avec le chemin de / index en plus de tous les articles de blog écrits avec l'année dans le permalien:

Mon modèle de filtre personnalisé pour le champ de filtrage Url de la requête:

 ^ / (index | [0-9] {4}  /) 

Cela indique essentiellement de rechercher / index OU tout chemin numérique à 4 chiffres se terminant par une barre oblique finale. J'ai créé une vue dans Analytics et ajouté ceci comme filtre:

 Filtre de vue Google Analytics

Voici quelques exemples supplémentaires:

  • Vous avez un blog avec l'année dans l'URL permalink path et vous souhaitez filtrer la liste sur n'importe quelle année. Je veux donc 4 chiffres numériques suivis d'une barre oblique finale. Demander un modèle de filtre URl :
 ^ / [0-9] {4}  / 
  • Vous voulez comparer toutes vos pages dont le titre a un certificat ou certification dedans. Modèle de filtre de titre de page :
 (. *) Certificat (. *) 
  • Vous souhaitez comparer deux pages de destination en fonction de leur support de campagne passé dans l'URL de la campagne Google Analytics ] as utm_medium = directmail ou paidsearch .
 (directmail | paidsearch) 
  • Vous voulez comparer tous les produits qui sont des chemises pour hommes en fonction du chemin de l'URL. Request URl Filter Pattern :
 ^ / mens / shirt / (. *) 
  • Vous voulez comparer toutes les pages numérotées avec le chemin URL qui se termine par le numéro. Demande de modèle de filtre URl :
 ^ / page / [1-9] * / $ 
  • Vous souhaitez exclure une plage d'adresses IP. Exclure le modèle de filtre d'adresse IP :
 123  .456  .789 . [0-9] 
  • Vous voulez inclure une page de remerciement.html où une soumission a réussi en fonction de la querystring success = true. Request URl Filter Pattern :
 thankyou  .html ? Success = true 

Comment tester vos expressions Regex

Plutôt que d'essayer et d'errer dans Google Analytics, je passez à regex101 un outil fantastique pour tester vos expressions régulières. Il décompose même votre syntaxe pour vous et fournit les détails de votre expression régulière:

 expressions régulières regex101

Build, Test, and Debug Regex




Source link