Le Espressioni Regolari (in inglese “Regular Expressions” e abbreviate anche con “RegEx”) possono esserti di grande aiuto nella web analytics permettendoti di creare dei filtri.
Tipicamente le espressioni regolari sono pane quotidiano per i programmatori ma un grande incubo per i “markettari”.
Ciao Markettaro in ascolto, lo so che stai sudando freddo, ma ti prometto che anche tu puoi imparare le RegEx di base, te le spiegherò in modo molto semplice 🙂
Ma perchè devo conoscere le espressioni regolari? Che ho fatto di male?
Beh, devi conoscerle innanzitutto perchè sia in Google Analytics che in Google Tag Manager le Regular Expressions svolgono un importantissimo ruolo. Ad esempio in GTM servono da filtro per gli attivatori: indicano in pratica quando il tag deve attivarsi.
Quindi calma e sangue freddo, impariamo insieme quelle basilari 🙂
Il punto significa “sostituiscimi con qualsiasi carattere alfanumerico”.
Esempio:
Ci.o può essere ciao, ma anche Cieo, Ci8o, Ci@o e così via.
L’asterisco significa “sostituiscimi con zero o più del segno viene prima”.
Ad esempio:
Ciao* vuol dire Cia, Ciao, Ciaoo, Ciaooo, Ciaoooo eccetera.
Allo stesso modo Cia*o vuol dire Ciao, Ciaao, Ciaaao e così via.
Questa espressione regolare è veramente utile, puoi usarla per fare un sacco di cose bellissime.
Ad esempio poniamo il caso di avere un sito strutturato così:
/prodotti/uomo/scarpe/
/prodotti/donna/scarpe/
/prodotti/bambino/scarpe/
Se scrivi /prodotti/*/scarpe/ stai includendo tutti e tre questi percorsi.
Ti faccio un esempio pratico: se volessi filtrare tutte le pagine contenenti le guide, su Tag Manager Italia, potrei andare su: Comportamento > Contenuti del sito > Tutte le pagine e digitare nel filtro /guida*.
Ecco, ora che abbiamo capito il significato del punto (.) e dell’asterisco (*), possiamo capire meglio cosa significa la combinazione di questi due caratteri.
Questa espressione regolare ti servirà spesso (soprattutto in Google Tag Manager 🙂 ), perché vuol dire “tutto”, inteso come “qualsiasi carattere alfanumerico”.
Ad esempio quando crei un attivatore devi inserire un filtro, poniamo caso:
“Page URL corrisponde all’espressione regolare .*”
Questo vorrà dire “attivati in tutte le pagine” (nello specifico: in corrispondenza di TUTTE le page URL del sito).
Questo carattere ti sarà di enorme aiuto! Infatti serve per “annullare” l’effetto di un carattere che altrimenti, in sintassi regex, darebbe un comando preciso.
Infatti, posto prima di un carattere speciale regex, serve a considerarlo come un carattere normale. Vedrai che sarà una mano santa nei casi di ambiguità.
Poniamo l’esempio degli indirizzi IP:
IP address = 131\.45\.78\.994
Il punto che separa i numeri nell’indirizzo IP, nel caso delle espressioni regolari, verrebbe considerato un carattere speciale e manderebbe in tilt il filtro. Usando il backslash invece stiamo comunicando che si tratta di caratteri normali.
Se ad esempio vuoi creare una vista su Google Analytics che escluda un indirizzo IP, vai su:
Amministrazione > Vista > Filtri > Aggiungi Filtro
Scegli Tipo di filtro: personalizzato > Escludi: Indirizzo IP e digita l’indirizzo IP con i Backslash.
Un altro esempio di uso dei Backslash è questo:
www\.miosito\.it
Capisci quanto può essere utile? 🙂
Vuol dire “inizia con…”
Esempio: ^scarpe
potrebbe voler dire scarpette, scarpe da corsa, scarpe rosse, etc…
E’ come l’opposto del caret (^) perchè vuol dire “finisce con…”, escludendo qualsiasi cosa possa venire dopo.
Salut$ esclude quindi Salutare, Salute, Salutista, Saluterò, eccetera.
Vuol dire che l’ultimo carattere è facoltativo.
Cia?o può essere sia Ciao che Cio.
Può essere utilizzato anche per aggirare errori di battitura.
Le parentesi sono facili da capire perché funzionano proprio come nella matematica: raggruppano caratteri.
Il pipe, ovvero quell’asticella lunga lunga, significa “OR” (“oppure” in italiano) e mette in relazione il carattere che precede con quello che viene dopo, in questo modo:
Ci|ao vuol dire Cio OPPURE Cao
Se vogliamo includere più segni nella relazione OR, possiamo usare le parentesi, così:
Barb(at|ru)cco vuol dire Barbatcco oppure Barbrucco
Capito? Beh, magari usalo in modo che abbia più senso 😛
Spesso utilizzate insieme al trattino, servono a creare delle liste semplici, ad esempio:
Ciao[1–5] vuol dire Ciao1, Ciao2, Ciao3, Ciao4 e Ciao5.
Anche in abbinamento ai numeri, quindi:
201[5–7] vuol dire 2015, 2016, 2017.
Senza il trattino, per ottenere l’effetto qui sopra dovremmo scrivere: 201[567]
Abbiamo già capito più o meno a cosa serve, ma osserviamolo meglio: usato insieme alle parentesi quadre serve a creare delle corrispondenze fra intervalli di caratteri. Ad esempio:
Vuol dire “uno o più del segno precedente”. Potrebbe essere confuso con l’asterisco, ma a differenza sua non comprende lo zero.
Esempio:
Ciao+ può essere Ciao, Ciaoo, Ciaooo, Ciaoooo, eccetera (ma non Cia, per quello dovremmo usare l’asterisco).
{2} vuol dire “ripeti l’ultimo segno 2 volte”.
Barbatruc{2}o quindi vorrebbe dire Barbatrucco
mentre Barbatruc{4}o quindi vorrebbe dire Barbatrucccco.
{1,2} definisce il numero minimo e massimo di volte in cui il carattere che precede si può ripetere.
Vuol dire in pratica “ripeti l’ultimo segno almeno una volta ma non più di due”.
Esempio:
“cia{1,2}o” vuol dire “ciao” oppure “ciaao”.
Fiuuuu… le espressioni regolari principali sono già finite! Non era così difficile, vero? 😀
Hai paura di aver pasticciato con le espressioni regolari? Non ti preoccupare: esistono dei tool online che ti permettono di verificarle prima di usarle. Ti lascio un link qua sotto 🙂
Quando qualche anno fa Google Tag Manager lanciò l’Attivatore Visibilità di un Elemento ricordo ancora…
Non credo sia necessario specificare che oggi la maggior parte delle visite e una bella…
Se sei un digital marketer o un digital analyst probabilmente saprai quanto oggi sia importante…
In occasione dell’evento “ECOMMERCE FOOD CONFERENCE” di Bologna, Tag Manager Italia ha condotto una ricerca…
Google Analytics 4 è uno strumento straordinario per raccogliere e analizzare i dati sul comportamento…
Se segui le guide e i webinar di Tag Manager Italia da un po’, probabilmente…
View Comments
Ciao Matteo.
Devo tracciare una conversione che sta su un sottodominio in GA Universal;
La landing page è del tipo:
venderepremium.miosito.com ( dove ho impostato la vista)
la ths page è del tipo:
tutorialvenderepremium.miosito.com
In entrambi i casi le url finiscono con dati parametrici
Come posso fare?
NOn riesco a capire che espressione regolare settare
Grazie mille
Ciao Marco, dovresti usare anche la dimensione hostname e filtrare quindi per il dominio :)
Fammi sapere, nel caso ti aspetto nel gruppo Facebook: https://www.facebook.com/groups/TagManagerItalia