Clear Sky Science · nl

Verbetering van creditcardfraudedetectie met een hybride aanpak met machine- en deep learning

· Terug naar het overzicht

Waarom dit belangrijk is voor uw portemonnee

Elke keer dat u uw kaart gebruikt of online winkelt, begint er een stille race: kunnen de computers van uw bank een dief ontdekken voordat uw geld verdwijnt? Nu digitale betalingen wereldwijd exploderen, bedenken criminelen voortdurend nieuwe trucs, en eenvoudige op regels gebaseerde beveiliging (zoals "blokkeer alle transacties boven €5.000 ‘s nachts") is niet meer voldoende. Deze studie laat zien hoe het combineren van verschillende vormen van kunstmatige intelligentie tot een enkel "team van experts" bijna iedere valse creditcardtransactie in een veelgebruikt echt dataset kan opsporen, terwijl het ook uitlegt waarom het systeem elke beslissing nam.

Figure 1
Figuur 1.

De stijgende golf van digitale trucs

Creditcardfraude is big business. De wereldwijde verliezen lopen al in de tientallen miljarden dollars per jaar en zullen naar verwachting blijven stijgen nu e‑commerce, internetbankieren en contantloze betalingen groeien. De meeste transacties zijn volkomen legitiem, maar een klein deel is frauduleus—soms minder dan twee op de duizend. Dat onevenwicht maakt het probleem lastig: een systeem kan er erg nauwkeurig uitzien door bijna alles als "normaal" te bestempelen, maar toch het grootste deel van de fraude missen. De auteurs richten zich op dit onevenwicht en op het feit dat fraudetactieken blijven veranderen, wat samen flexibele, datagedreven hulpmiddelen vereist in plaats van starre handgeschreven regels.

Zeldzame fraude omzetten in een leerbaar signaal

De onderzoekers beginnen met een echte set Europese creditcardtransacties die over twee dagen zijn verzameld: ongeveer 285.000 betalingen, waarvan slechts 492 frauduleus zijn. Om ervoor te zorgen dat het model niet verdrinkt in normale gevallen, gebruiken ze een techniek die realistisch ogende extra voorbeelden van de zeldzame klasse fabriceert zodat de gegevens meer in balans raken. De hoofdmethodiek, SMOTE genoemd, creëert synthetische, frauduleuze punten tussen echte fraudegevallen in. Ze testen ook een complexere hybride methode die zowel minderheidsvoorbeelden toevoegt als luidruchtige meerderheidsvoorbeelden verwijdert. Door transactiesommen en -tijden zorgvuldig te schalen en gevoelige details achter wiskundige transformaties te verbergen, bereiden ze een schone, privacybeschermende dataset voor waarvan een computer kan leren.

Een team van digitale fraudejagers samenstellen

In plaats van te wedden op één algoritme, trainen de auteurs 37 verschillende modellen afkomstig uit klassieke machine learning, moderne boosted decision trees en diepe neurale netwerken. Vervolgens ontwerpen ze twee speciale "stacking ensembles", die functioneren als een raad van specialisten wiens meningen door een eindrechter worden gecombineerd. In het eerste ensemble bestuderen een snel boomgebaseerd model, een patroonherkennend netwerk in beeldstijl en een sequentiebewust netwerk elk dezelfde transacties. Hun output wordt vervolgens gevoed aan een krachtig booster-model dat leert hoeveel vertrouwen het aan elke specialist moet geven. Het tweede ensemble combineert meerdere soorten tree-based boosters en forests in een vergelijkbare gelaagde opzet. Beide ensembles worden eerst getraind op de oorspronkelijke scheve data en daarna opnieuw op de in balans gebrachte versie die door SMOTE en de hybride methode is geproduceerd.

Figure 2
Figuur 2.

Bijna perfecte detectie en wat het kost

Op de met SMOTE gebalanceerde gegevens bereiken beide voorgestelde ensembles opvallend hoge scores op alle gangbare succesmaten: ze missen bijna nooit een frauduleuze transactie en veroorzaken bijna nooit een vals alarm bij een echte transactie in deze dataset. Wanneer de auteurs vergelijken met veel individuele modellen en met eerder gepubliceerde methoden die dezelfde data gebruikten, komen hun gestapelde systemen consequent als beste uit de bus. Ze meten ook het praktische aspect: hoe lang training duurt en hoeveel geheugen nodig is. Het ensemble dat zwaar leunt op diepe neurale netwerken is rekenkundig duurder, terwijl het op bomen gefocuste ensemble vergelijkbare nauwkeurigheid levert met aanzienlijk lagere tijd- en geheugeneisen, wat het aantrekkelijker maakt voor realtime banksystemen.

Inzien wat er in de zwarte doos gebeurt

Een veelvoorkomende zorg bij geavanceerde AI is dat het als een zwarte doos werkt: zelfs de ontwerpers weten misschien niet waarom het uw aankoop als verdacht markeerde. Om dit aan te pakken, gebruikt de studie twee uitleggereedschappen die laten zien welke verborgen kenmerken van een transactie het meest van belang zijn voor een bepaalde beslissing en voor het systeem als geheel. Visuele analyses onthullen een kleine set getransformeerde variabelen die herhaaldelijk de fraudepredicties aansturen, terwijl veel andere slechts een ondersteunende rol spelen. De auteurs onderzoeken ook waar de modellen nog fouten maken, hoe zeker ze zijn wanneer ze een fout maken, en hoe goed de resultaten standhouden naarmate er meer data wordt gebruikt. Deze controles suggereren dat de modellen daadwerkelijk stabiele patronen leren in plaats van alleen de trainingsdata te memoriseren.

Wat dit betekent voor dagelijkse kaarthouders

Voor niet-experts is de kop geruststellend: door de data slim te balanceren en meerdere AI-benaderingen samen te laten werken, kunnen banken fraudedetectoren bouwen die zowel extreem nauwkeurig zijn op benchmarkdata als redelijk efficiënt in gebruik. Even belangrijk is dat het systeem zijn beslissingen kan uitleggen, wat instellingen helpt het te vertrouwen en te verfijnen en toezichthouders helpt het gedrag te begrijpen. Hoewel implementatie in de echte wereld nog uitdagingen kent—zoals steeds evoluerende criminele tactieken en de noodzaak van snelle, continue updates—biedt deze hybride aanpak een sterk stappenplan om uw kaart veilig te houden zonder u te overspoelen met valse meldingen.

Bronvermelding: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4

Trefwoorden: detectie van creditcardfraude, machine learning, deep learning, ensemblemodellen, onevenwichtige gegevens