Glossario

Glossario: Espressioni Regolari (Regular Expressions)

Le Espressioni Regolari (in inglese “Regular Expressions” e abbreviate anche con “RegEx”) possono esserti di grande aiuto nella web analytics permettendoti di creare dei filtri.

Tipicamente le espressioni regolari sono pane quotidiano per i programmatori ma un grande incubo per i “markettari”.

Ciao Markettaro in ascolto, lo so che stai sudando freddo, ma ti prometto che anche tu puoi imparare le RegEx di base, te le spiegherò in modo molto semplice 🙂

Ma perchè devo conoscere le espressioni regolari? Che ho fatto di male?

Beh, devi conoscerle innanzitutto perchè sia in Google Analytics che in Google Tag Manager le Regular Expressions svolgono un importantissimo ruolo. Ad esempio in GTM servono da filtro per gli attivatori: indicano in pratica quando il tag deve attivarsi.

Quindi calma e sangue freddo, impariamo insieme quelle basilari 🙂

 

Punto (.)

Il punto significa “sostituiscimi con qualsiasi carattere alfanumerico”.

Esempio:

Ci.o può essere ciao, ma anche Cieo, Ci8o, Ci@o e così via.

 

Asterisco (*)

L’asterisco significa “sostituiscimi con zero o più del segno viene prima”.

Ad esempio:

Ciao* vuol dire Cia, Ciao, Ciaoo, Ciaooo, Ciaoooo eccetera.

Allo stesso modo Cia*o vuol dire Ciao, Ciaao, Ciaaao e così via.

Questa espressione regolare è veramente utile, puoi usarla per fare un sacco di cose bellissime.

Ad esempio poniamo il caso di avere un sito strutturato così:

/prodotti/uomo/scarpe/
/prodotti/donna/scarpe/
/prodotti/bambino/scarpe/

Se scrivi /prodotti/*/scarpe/ stai includendo tutti e tre questi percorsi.

Ti faccio un esempio pratico: se volessi filtrare tutte le pagine contenenti le guide, su Tag Manager Italia, potrei andare su: Comportamento > Contenuti del sito > Tutte le pagine e digitare nel filtro /guida*.

Punto-asterisco (.*)

Ecco, ora che abbiamo capito il significato del punto (.) e dell’asterisco (*), possiamo capire meglio cosa significa la combinazione di questi due caratteri.
Questa espressione regolare ti servirà spesso (soprattutto in Google Tag Manager 🙂 ), perché vuol dire “tutto”, inteso come “qualsiasi carattere alfanumerico”.

Ad esempio quando crei un attivatore devi inserire un filtro, poniamo caso:

“Page URL corrisponde all’espressione regolare .*

Questo vorrà dire “attivati in tutte le pagine” (nello specifico: in corrispondenza di TUTTE le page URL del sito).

Backslash (\)

Questo carattere ti sarà di enorme aiuto! Infatti serve per “annullare” l’effetto di un carattere che altrimenti, in sintassi regex, darebbe un comando preciso.

Infatti, posto prima di un carattere speciale regex, serve a considerarlo come un carattere normale. Vedrai che sarà una mano santa nei casi di ambiguità.

Poniamo l’esempio degli indirizzi IP:

IP address = 131\.45\.78\.994

Il punto che separa i numeri nell’indirizzo IP, nel caso delle espressioni regolari, verrebbe considerato un carattere speciale e manderebbe in tilt il filtro. Usando il backslash invece stiamo comunicando che si tratta di caratteri normali.

Se ad esempio vuoi creare una vista su Google Analytics che escluda un indirizzo IP, vai su:

Amministrazione > Vista > Filtri > Aggiungi Filtro

Scegli Tipo di filtro: personalizzato > Escludi: Indirizzo IP e digita l’indirizzo IP con i Backslash.

Un altro esempio di uso dei Backslash è questo:

www\.miosito\.it

Capisci quanto può essere utile? 🙂

 

Caret (^)

Vuol dire “inizia con…”

Esempio: ^scarpe

potrebbe voler dire scarpette, scarpe da corsa, scarpe rosse, etc…

 

Simbolo del dollaro ($)

E’ come l’opposto del caret (^) perchè vuol dire “finisce con…”, escludendo qualsiasi cosa possa venire dopo.

Salut$ esclude quindi Salutare, Salute, Salutista, Saluterò, eccetera.

 

Punto interrogativo (?)

Vuol dire che l’ultimo carattere è facoltativo.

Cia?o può essere sia Ciao che Cio.

Può essere utilizzato anche per aggirare errori di battitura.

 

Parentesi tonde ()

Le parentesi sono facili da capire perché funzionano proprio come nella matematica: raggruppano caratteri.

 

Pipe (|)

Il pipe, ovvero quell’asticella lunga lunga, significa “OR” (“oppure” in italiano) e mette in relazione il carattere che precede con quello che viene dopo, in questo modo:

Ci|ao vuol dire Cio OPPURE Cao

Se vogliamo includere più segni nella relazione OR, possiamo usare le parentesi, così:

Barb(at|ru)cco vuol dire Barbatcco oppure Barbrucco

Capito? Beh, magari usalo in modo che abbia più senso 😛

 

Parentesi quadre ([])

Spesso utilizzate insieme al trattino, servono a creare delle liste semplici, ad esempio:
Ciao[15] vuol dire Ciao1, Ciao2, Ciao3, Ciao4 e Ciao5.

Anche in abbinamento ai numeri, quindi:

201[57] vuol dire 2015, 2016, 2017.

Senza il trattino, per ottenere l’effetto qui sopra dovremmo scrivere: 201[567]

 

Trattino breve (-)

Abbiamo già capito più o meno a cosa serve, ma osserviamolo meglio: usato insieme alle parentesi quadre serve a creare delle corrispondenze fra intervalli di caratteri. Ad esempio:

 

  • [az] vuol dire “tutte le lettere dalla a alla z minuscole”
  • [AZ] vuol dire “tutte le lettere dalla a alla z maiuscole”
  • [09] vuol dire “tutti i numeri” (molto usato ad esempio per gli e-commerce con prodotti che hanno modelli numerati)

 

Segno più (+)

Vuol dire “uno o più del segno precedente”. Potrebbe essere confuso con l’asterisco, ma a differenza sua non comprende lo zero.

Esempio:

Ciao+ può essere Ciao, Ciaoo, Ciaooo, Ciaoooo, eccetera (ma non Cia, per quello dovremmo usare l’asterisco).

 

Parentesi graffe ({ })

{2} vuol dire “ripeti l’ultimo segno 2 volte”.

Barbatruc{2}o quindi vorrebbe dire Barbatrucco
mentre Barbatruc{4}o quindi vorrebbe dire Barbatrucccco.

{1,2} definisce il numero minimo e massimo di volte in cui il carattere che precede si può ripetere.

Vuol dire in pratica “ripeti l’ultimo segno almeno una volta ma non più di due”.
Esempio:

“cia{1,2}o” vuol dire “ciao” oppure “ciaao”.
Fiuuuu… le espressioni regolari principali sono già finite! Non era così difficile, vero? 😀

Hai paura di aver pasticciato con le espressioni regolari? Non ti preoccupare: esistono dei tool online che ti permettono di verificarle prima di usarle. Ti lascio un link qua sotto 🙂

LINK UTILI:

Matteo Zambon

View Comments

  • Ciao Matteo.
    Devo tracciare una conversione che sta su un sottodominio in GA Universal;
    La landing page è del tipo:
    venderepremium.miosito.com ( dove ho impostato la vista)
    la ths page è del tipo:
    tutorialvenderepremium.miosito.com

    In entrambi i casi le url finiscono con dati parametrici

    Come posso fare?
    NOn riesco a capire che espressione regolare settare

    Grazie mille

Share
Published by
Matteo Zambon

Recent Posts

Come tracciare la visualizzazione di una sezione specifica all’interno di una pagina web o landing page in GA4 con Google Tag Manager

Quando qualche anno fa Google Tag Manager lanciò l’Attivatore Visibilità di un Elemento ricordo ancora…

1 anno ago

Come tracciare i click al link di contatto WhatsApp in Google Analytics 4 con Google Tag Manager

Non credo sia necessario specificare che oggi la maggior parte delle visite e una bella…

1 anno ago

Privacy in GA4: i sistemi di protezione dei dati e del consenso degli utenti tua disposizione

Se sei un digital marketer o un digital analyst probabilmente saprai quanto oggi sia importante…

1 anno ago

E-commerce e Digital Analytics: il 32,5% delle aziende nel settore Food non usa strumenti di tracciamento dati per aumentare i propri profitti

In occasione dell’evento “ECOMMERCE FOOD CONFERENCE” di Bologna, Tag Manager Italia ha condotto una ricerca…

1 anno ago

Cos’è la Data Retention di GA4 e come gestirla nel modo corretto

Google Analytics 4 è uno strumento straordinario per raccogliere e analizzare i dati sul comportamento…

2 anni ago

Modelli di attribuzione di GA4: quali utilizzare e come analizzare i dati nei report

Se segui le guide e i webinar di Tag Manager Italia da un po’, probabilmente…

2 anni ago