Clear Sky Science · it

Un nuovo framework ibrido di deep learning per la predizione del churn dei clienti usando RFM e clustering di embedding

· Torna all'indice

Perché è importante trattenere gli acquirenti online

Ogni negozio online si confronta con la stessa domanda: quali clienti si stanno allontanando silenziosamente e quali hanno più probabilità di tornare? Scoprire questo in anticipo permette alle aziende di spendere meno per inseguire nuovi acquirenti e più per mantenere quelli già acquisiti. Questo studio introduce un metodo guidato dai dati per individuare i clienti a rischio convertendo storie di click e acquisti disordinate in segnali chiari che indicano che una persona sta per smettere di comprare.

Figure 1. Come l’analisi dei modelli di acquisto online può separare i clienti fedeli da quelli propensi ad abbandonare.
Figure 1. Come l’analisi dei modelli di acquisto online può separare i clienti fedeli da quelli propensi ad abbandonare.

Osservare quanto e quanto spesso le persone acquistano

Gli autori partono da un’idea semplice che molti marketer già conoscono: i clienti differiscono per quanto di recente hanno acquistato, con quale frequenza lo fanno e quanto spendono. Questi tre numeri, chiamati recency, frequency e monetary value, delineano un quadro di base di ogni acquirente. Chi compra spesso, spende di più e ha acquistato di recente è generalmente fedele. Chi non compra da molto, lo fa raramente e spende poco è più propenso ad andarsene. Lo studio utilizza questi tre segnali, più alcune statistiche temporali aggiuntive, come fondamento per tutte le analisi successive.

Raggruppare gli acquirenti con abitudini simili

Invece di trattare tutti i clienti come un unico gruppo, i ricercatori li segmentano prima in base al comportamento. Usano una tecnica di deep learning che comprime il profilo di acquisto di ciascun cliente in un codice compatto, quindi forma automaticamente cluster in questo spazio di codifica. Questo permette di trovare pattern difficili da vedere con regole semplici, come differenze sottili tra acquirenti regolari e costanti, clienti stagionali e chi sta progressivamente allontanandosi. I cluster risultanti corrispondono a significati commerciali reali: alcuni gruppi sono quasi interamente costituiti da clienti fedeli, mentre altri contengono una quota elevata di persone prossime all’abbandono.

Figure 2. Come un modello passo-passo trasforma flussi di eventi di acquisto in predizioni accurate su chi abbandonerà.
Figure 2. Come un modello passo-passo trasforma flussi di eventi di acquisto in predizioni accurate su chi abbandonerà.

Insegnare al sistema a seguire i percorsi dei clienti nel tempo

Dopo aver raggruppato i clienti, lo studio alimenta questi segmenti, insieme ai modelli di spesa, in reti neurali adatte a trattare sequenze. Queste reti, originariamente progettate per leggere frasi o segnali audio, qui leggono invece flussi di eventi di acquisto. Imparano come l’attività di una persona cambia nel corso di settimane o mesi e come tali cambiamenti tendono a concludersi, o con continui acquisti o con il silenzio. I ricercatori addestrano e testano i loro modelli su due set di dati reali molto diversi, uno composto da tradizionali registri di acquisto e un altro costruito da dettagliati log di click ed eventi.

Confrontare i nuovi metodi con gli strumenti tradizionali

Il team confronta quindi il loro approccio ibrido con strumenti standard come la regressione logistica e le macchine a vettori di supporto. I modelli semplici funzionano bene quando i dati sono già ordinati ma incontrano difficoltà quando il comportamento è complesso o rumoroso. Al contrario, il nuovo framework prima rimodella i dati tramite clustering profondo e poi cattura i pattern temporali con reti sequenziali. Su entrambi i dataset, questa configurazione raggiunge un’accuratezza vicina alla perfezione mantenendo un equilibrio tra l’individuazione dei churner e il non generare troppe false segnalazioni. Uno studio di ablazione mostra che aggiungere il passaggio di clustering migliora chiaramente le prestazioni rispetto all’uso delle sole reti sequenziali.

Cosa significa questo per le aziende online

Per un non specialista, il messaggio principale è che un uso più ricco dei dati su quando e come le persone fanno acquisti può trasformare i registri di routine in avvisi precoci su chi è probabile che abbandoni. Combinando semplici riepiloghi di spesa, una segmentazione intelligente dei clienti e modelli che seguono il comportamento nel tempo, il framework offre un modo più affidabile per segnalare i clienti a rischio. Le aziende possono così concentrare offerte di retention, assistenza o contenuti sulle persone che più necessitano attenzione, migliorando la fedeltà senza affidarsi al solo istinto o al caso.

Citazione: Ibrahim, S., Tawfik, B.S., Makhlouf, M.A. et al. A novel hybrid deep learning framework for customer churn prediction using RFM and embedding clustering. Sci Rep 16, 16563 (2026). https://doi.org/10.1038/s41598-026-53220-0

Parole chiave: customer churn, e-commerce, segmentazione clienti, deep learning, analisi RFM