Altre news Data Management Platform

Published on aprile 11th, 2016 | by Alessandro Sisti

0

Data Management Platform: i benefici della segmentazione e del lookalike modeling (Parte 2)

Social Sharing

Abbiamo visto in un precedente post le aree di funzionalità tipiche di una Data Management Platform: ingestion e storage, segmentazione delle audience, invio delle istruzioni a sistemi terzi (Ad server, Content Management System, Demand Side Platform). I Publisher e gli Advertiser che cominciano ad utilizzare le DMP per prendere decisioni di personalizzazione contenuti e acquisto di spazi pubblicitari targetizzati in tempo reale, possono creare e segmentare le proprie audience sulla base di attributi specifici digitali e non (esempio: età, sesso, capacità di spesa, interessi) calcolando la numerosità degli Universal ID’s nei singoli segmenti. Gli Universal ID’s consentono di creare user record complessi, somma di attributi provenienti da sistemi informativi del publisher (1rst data) e di partner terzi (2nd e 3rd data). Gli utenti sono poi tracciati ed individuati mentre navigano sul un sito con un cookie univoco e sono quindi attribuiti ad un segmento specifico di audience.

Le piattaforme consentono poi di stimare le sovrapposizioni tra i diversi segmenti, eseguendo il c.d lookalike modeling ,utilizzando modelli statistici con regressione lineare o multipla e/o e algoritmi machine learning. Il primo passo per la costruzione di un segmento “lookalike” è la definizione del nostro segmento target. A titolo di esempio possiamo immaginare che un sito di un publisher con 100.000 utenti qualificati giornalieri, abbia individuato i seguenti segmenti di audience:

  • Uomini (20,000 utenti, 20% del totale)
  • Amanti delle tecnologie ( 5.000 utenti, 5% del totale)
  • i video-makers (8.000 utenti, 8 % del totale)
  • I Trend Setter ( 9.000 utenti, 9% del totale)
  • Viaggiatori (14.000 utenti, 14% del totale)
  • Sportivi (2.800 utenti, 2,8% del totale)
  • Lettori incalliti (7.000 utenti, 7% del totale)

 

Diciamo che il nostro publisher vuole espandere il segmento “uomini” , verificando gli overlap e la presenza di questo specifico target negli altri segmenti: in questo modo i riesce ad incrementare il numero di impression targettizzate da vendere sul mercato per contattare uno specifico segmento di audience considerato appetibile dai suoi inserzionisti. Come abbiamo visto, dalla prima segmentazione è stata identificata una audience di 20.000 uomini, su un totale di 100.000 (20%). Possiamo immaginare che ci siano quindi ulteriori utenti “uomini” nel restante 80% degli utenti del sito, e la DMP calcola le sovrapposizioni (overlap) tra il nostro segmento target e gli altri segmenti. In pratica, stimeremo il numero di maschi che amano le tecnologie e sono video makers e trend setter. Vediamo un esempio numerico:

 

Segmento di Test Utenti nel segmento di Test Sovrapposizione segmento target donna (numero donne nel segmento test)
Amanti delle tecnologie 5,000 1,500
Video Makers 8,000 500
Trend Setter 9,000 1,200
Viaggiatori 14,000 3,000
Sportivi 2,800 1,000
Lettori incalliti. 7,000 900

 

Ogni segmento di test ha un numero differente di utenti e una specifica sovrapposizione con il segmento “uomini”. Quello che dobbiamo ora fare è trovare un modo di comparare le diverse sovrapposizioni. Mi spiego meglio: se tra i viaggiatori c’è il numero assoluto più alto di uomini (3.000), questo non significa che il segmento in oggetto è quello che ha la maggiore probabilità di avere uomini al suo interno. Per fare questo dobbiamo confrontare questa sovrapposizione con il numero totale dei maschi e calcolarci il peso relativo. Questo è esattamente quello che andremo a fare per creare un segmento “lookalike”, per determinare quindi se un segmento di test ha la probabilità di avere un numero di uomini maggiore rispetto al totale utenti presenti nel segmento. Troveremo inizialmente la percentuale  sovrapposizione di ogni segmento di test (amanti delle tecnologie, video makers, trend setter, viaggiatori, sportivi, lettori incalliti) dividendo il numero di utenti in overlap con il segmento di utenti “uomini”.  In sintesi nella tabella trovate il dettaglio

 

Segmento Test Utenti totali nel segmento Test S Sovrapposizione Uomini Totali Concentrazione Uomini Segmento Test su Uomini
Amanti delle tecnologie 5,000 1,500 20,000 7.5%
Video Makers 8,000 500 20,000 2.5%
Trend setter 9,000 1,200 20,000 6%
Viaggiatori 14,000 3,000 20,000 15%
Sportivi 2,800 1,000 20,000 5%
Lettori incalliti 7,000 900 20,000 4.5%

 

Nella fase finale dividiamo la concentrazione relativa di uomini di ciascun segmento di test con la concentrazione sul totale della popolazione del sito (100.000 utenti), creando un indice semplice di concentrazione del segmento di test in quello delle uomini (moltiplicando il risultato per 100, che è il nostro benchmark). Ogni segmento con un indice maggiore di 100 tenderà ad avere con più probabilità uomini rispetto alla concentrazione sulla popolazione totale. Nel nostro caso, a titolo di esempio, per il segmento test dei “Viaggiatori”, dividendo (15% / 14%) x 100 otteniamo un indice di concentrazione di 107, mentre per gli Sportivi la concentrazione è di 179 (quindi maggiore rispetto alla concentrazione degli uomini sul totale utenti del sito).

 

Segmento Test Utenti totali segmento test Sovrapposizione Concentrazione Segmento Test sugli utenti totali Concentrazione del segmento test sul segmento Uomini Concentrazione Relativa Segmento Test sul Segmento Uomini (indice)
Amanti tecnologie 5,000 1,500 5% 7.5% 150
Video Makers 8,000 500 8% 2.5% 31
Trend Setter 9,000 1,200 9% 6% 67
Viaggiatori 14,000 3,000 14% 15% 107
Sportivi 2,800 1,000 2.8% 5% 179
Lettori incalliti 7,000 900 7% 4.5% 64

Con i dati della tabella è possibile modellare le nostre audience per trovare quali siano i segmenti che hanno una maggiore probabilità di avere uomini al loro interno (Sportivi 179, Amanti delle Tecnologie 150, Viaggiatori 107) e quelli che non ne hanno (Trend Setter 67Lettori incalliti 64, , Video Makers 31).

La tecnica descritta è anche molto utile per ottimizzare campagne digitali con obiettivi di direct response che hanno nelle metriche di click e conversione i principali KPI. Le campagne potrebbero partire in modalità ROS (Rotation on site) per essere esposte a tutte le audience di un sito e dopo un certo numero di giorni verificare quali sono i segmenti che rispondono meglio in termini di click e conversione, targettizzando la campagna su quelle audience. Nell’esempio di prima, la campagna viene esposta indifferentemente a tutte le audience. Ci si accorge poi che gli uomini sono quelli che performano meglio in termini di click e/o conversione. L’Ad Server quindi espone la campagna ai soli uomini del sito. Successivamente si calcolano le sovrapposizioni di uomini con gli altri segmenti, e la campagna viene quindi mostrata alle audience espanse (segmenti con maggiore probabilità di avere uomini al loro interno) incrementando il numero di impression vendute (per il publisher) e migliorando la perfomance per l’advertisers.

L’Ad server riceve i dati di segmentazione degli utenti del publisher con queste tre modalità, client side e/o server to server:

-la Dmp riscrive la chiamata all’adserver, per includere una coppia di valori Key Value collegati al segmento specifico di “uomini”)

– la coppia di valori key value viene inserita in un cookie che l’Ad Sever legge durante la chiamata

– la DMP ha già passato i dati key value dei diversi segmenti di utenti del sito. L’Ad Server conosce quindi i segmenti di utenti del sito e mostra i formati pubblicitari personalizzati per il segmento “uomini”. Una variante prevede una integrazione server to server che chiama la DMP quando l’ad unit viene servita.

La piattaforma DMP infine legge ogni decisione di Ad Serving, impression per impression, user per user, producendo report di ingaggio per segmenti di utenti. Si possono poi scoprire ulteriori segmenti che reagiscono bene alla campagna, espandendo il reach / utenti targettizzati che saranno esposti alla stessa.

In ogni caso, il rischio insito in questa metodologia è nella poca numerosità delle sovrapposizioni in ogni segmento. Questo infatti puo’ ridurre significativamente il significato dell’indice di concentrazione e non si hanno quindi dati sufficienti per portare a compimento un lookalike modeling. Uno statistico potrebbe indicarci quale dovrebbe essere il minimo campione sufficiente per dare senso all’analisi ma più o meno, sovrapposizioni di 400-500 utenti sono sufficienti per darci analisi concrete che massimizzano i benefici dell’utilizzo di una DMP.


About the Author

Alessandro Sisti è Google Certified Professional, esperto di pianificazione digitale automatizzata attraverso le piattaforme di Google Adwords e DoubleClick Ad Exchange. Internet Entrepeneur,Digital Strategist e Consulente, insegna nei master di specializzazione di Luiss Business School , Sole 24 Ore Formazione, Lumsa, Ied. Ha iniziato nel 1998 la sua carriera professionale in Ernst&Young Consultants, specializzandosi nella comunicazione digitale e nell’e-commerce. E’ stato Chief Operating Officer della Divisione Multimedia della concessionaria di pubblicità Sportnetwork (Gruppo Corriere dello Sport ) occupandosi della progettazione ,dello sviluppo e della comunicazione dei siti web, mobile, app di tutti i brand del gruppo editoriale (Corriere dello Sport, TuttoSport, Auto, Autosprint, Motosprint, Guerin Sportivo, AM)



Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Back to Top ↑