Clear Sky Science · it

Migliorare il rilevamento delle frodi con carte di credito con un approccio ibrido basato su machine e deep learning

· Torna all'indice

Perché questo riguarda il tuo portafoglio

Ogni volta che posi la carta o fai acquisti online inizia una gara silenziosa: i computer della tua banca riusciranno a individuare un ladro prima che i tuoi soldi spariscano? Con l’esplosione dei pagamenti digitali nel mondo, i criminali inventano continuamente nuovi stratagemmi, e la sicurezza basata su regole semplici (come “bloccare tutte le transazioni oltre 5.000$ di notte”) non è più sufficiente. Questo studio mostra come la combinazione di diversi tipi di intelligenza artificiale in un unico “team di esperti” possa intercettare quasi tutte le transazioni fraudolente in un dataset reale ampiamente utilizzato, spiegando al contempo perché il sistema ha preso ciascuna decisione.

Figure 1
Figure 1.

L’onda crescente dell’inganno digitale

La frode con carte di credito è un affare enorme. Le perdite globali già raggiungono decine di miliardi di dollari ogni anno e si prevede che continueranno a salire con la crescita dell’e‑commerce, dell’online banking e dei pagamenti senza contanti. La maggior parte delle transazioni è perfettamente legittima, ma una frazione piccolissima è fraudolenta—talvolta meno di due su mille. Questo sbilanciamento rende il problema difficile: un sistema può apparire molto accurato limitandosi a chiamare “normale” quasi tutto, pur non rilevando la maggior parte delle frodi. Gli autori si concentrano su questo sbilanciamento e sul fatto che le tattiche di frode continuano a cambiare, il che richiede strumenti flessibili e guidati dai dati piuttosto che regole rigide scritte a mano.

Trasformare le frodi rare in un segnale apprendibile

I ricercatori partono da un insieme reale di transazioni con carte europee raccolte in due giorni: circa 285.000 pagamenti, di cui solo 492 sono fraudolenti. Per evitare che il modello venga sommerso dai casi normali, utilizzano una tecnica che crea esempi extra realistici della classe rara in modo da bilanciare i dati. Il metodo principale, chiamato SMOTE, genera punti sintetici simili a frodi tra casi di frode reali. Testano anche un metodo ibrido più complesso che aggiunge esempi della minoranza e rimuove casi rumorosi della maggioranza. Scalando con cura gli importi e gli orari delle transazioni e nascondendo i dettagli sensibili dietro trasformazioni matematiche, preparano un dataset pulito e rispettoso della privacy da cui un computer può apprendere.

Costruire una squadra di cacciatori digitali di frodi

Invece di puntare su un singolo algoritmo, gli autori addestrano 37 modelli diversi presi dal machine learning classico, dagli alberi potenziati moderni e dalle reti neurali profonde. Poi progettano due speciali “ensemble a stacking”, che funzionano come un pannello di specialisti le cui opinioni vengono combinate da un arbitro finale. Nel primo ensemble, un modello ad albero veloce, una rete in grado di individuare pattern in stile immagine e una rete sensibile alle sequenze analizzano ciascuna le stesse transazioni. Le loro uscite vengono poi alimentate in un potente modello booster che impara quanto fidarsi di ciascuno specialista. Il secondo ensemble combina diversi tipi di booster ad albero e foreste in una struttura a più livelli simile. Entrambi gli ensemble sono addestrati prima sui dati originali sbilanciati e poi di nuovo sulla versione bilanciata prodotta da SMOTE e dal metodo ibrido.

Figure 2
Figure 2.

Rilevamento quasi perfetto e a che prezzo

Sui dati bilanciati creati con SMOTE, entrambi gli ensemble proposti raggiungono punteggi sorprendentemente alti su ogni misura standard di successo: quasi mai mancano una transazione fraudolenta e quasi mai segnalano un falso allarme su una transazione genuina in questo dataset. Quando gli autori confrontano i loro risultati con molti modelli individuali e con metodi pubblicati in precedenza che hanno usato gli stessi dati, i loro sistemi a stacking emergono costantemente in testa. Misurano anche l’aspetto pratico: quanto tempo richiede l’addestramento e quanta memoria è necessaria. L’ensemble che fa largo uso di reti neurali profonde è più costoso dal punto di vista computazionale, mentre l’ensemble concentrato sugli alberi fornisce un’accuratezza simile con richieste di tempo e memoria significativamente inferiori, rendendolo più interessante per i sistemi bancari in tempo reale.

Vedere dentro la scatola nera

Una preoccupazione comune con l’IA avanzata è che si comporti come una scatola nera: persino i suoi progettisti potrebbero non sapere perché ha contrassegnato il tuo acquisto come sospetto. Per affrontare questo aspetto, lo studio utilizza due strumenti di spiegazione che mostrano quali caratteristiche nascoste di una transazione contano di più per una decisione specifica e a livello di sistema. Analisi visive rivelano un piccolo insieme di variabili trasformate che ripetutamente guidano le predizioni di frode, mentre molte altre giocano solo un ruolo di supporto. Gli autori esaminano anche dove i modelli commettono ancora errori, quanto sono sicuri quando sbagliano e quanto bene i risultati resistono quando si utilizza più dati. Questi controlli suggeriscono che i modelli stanno davvero imparando pattern stabili piuttosto che limitarsi a memorizzare i dati di addestramento.

Cosa significa per gli utenti comuni di carte

Per i non esperti, la notizia è rassicurante: bilanciando i dati in modo intelligente e lasciando che più approcci di IA lavorino insieme, le banche possono costruire rilevatori di frodi che sono estremamente accurati sui dati di riferimento e ragionevolmente efficienti da eseguire. Ugualmente importante, il sistema può spiegare le sue decisioni, il che aiuta le istituzioni a fidarsi e affinarlo e aiuta i regolatori a comprenderne il comportamento. Sebbene il dispiegamento nel mondo reale affronti ancora sfide—come tattiche criminali in continua evoluzione e la necessità di aggiornamenti rapidi e continui—questo approccio ibrido offre un solido modello per mantenere la tua carta al sicuro senza sommergerti di falsi allarmi.

Citazione: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4

Parole chiave: rilevamento frodi con carte di credito, machine learning, deep learning, modelli ensemble, dati sbilanciati