Clear Sky Science · de

Verbesserung der Erkennung von Kreditkartenbetrug mit einem hybriden Ansatz aus Machine und Deep Learning

· Zurück zur Übersicht

Warum das für Ihr Portemonnaie wichtig ist

Jedes Mal, wenn Sie Ihre Karte auflegen oder online einkaufen, beginnt ein stilles Wettrennen: Können die Rechner Ihrer Bank einen Dieb entdecken, bevor Ihr Geld verschwindet? Mit der explosionsartigen Zunahme digitaler Zahlungen weltweit erfinden Kriminelle ständig neue Tricks, und einfache regelbasierte Sicherungen (wie „sperre alle Zahlungen über 5.000 $ nachts“) reichen nicht mehr aus. Diese Studie zeigt, wie das Kombinieren mehrerer Arten künstlicher Intelligenz zu einem „Expertenteam“ beinahe jede gefälschte Kreditkartentransaktion in einem weitverbreiteten realen Datensatz erkennen kann – und zugleich erklärt, warum das System jede Entscheidung getroffen hat.

Figure 1
Figure 1.

Die wachsende Flut digitaler Tricks

Kreditkartenbetrug ist ein großes Geschäft. Die weltweiten Verluste liegen bereits im zweistelligen Milliardenbereich pro Jahr und dürften weiter steigen, da E‑Commerce, Online‑Banking und bargeldlose Zahlungen zunehmen. Die meisten Transaktionen sind völlig legitim, aber ein winziger Bruchteil ist betrügerisch – manchmal weniger als zwei von tausend. Diese Ungleichheit macht das Problem schwierig: Ein System kann sehr genau erscheinen, indem es fast alles als „normal“ einstuft, und dennoch den Großteil des Betrugs übersehen. Die Autorinnen und Autoren konzentrieren sich auf dieses Ungleichgewicht und darauf, dass Betrugstaktiken sich laufend ändern, was flexible, datengesteuerte Werkzeuge statt starrer, handgeschriebener Regeln erfordert.

Seltene Betrugsfälle in ein lernbares Signal verwandeln

Die Forschenden beginnen mit einem realen Satz europäischer Kreditkartentransaktionen, die über zwei Tage gesammelt wurden: etwa 285.000 Zahlungen, davon nur 492 betrügerisch. Damit das Modell nicht in den normalen Fällen untergeht, verwenden sie eine Technik, die realistische zusätzliche Beispiele der seltenen Klasse erzeugt, sodass die Daten ausgeglichener werden. Die Hauptmethode, SMOTE genannt, erstellt synthetische, betrugsähnliche Punkte zwischen echten Betrugsfällen. Außerdem testen sie eine komplexere hybride Methode, die sowohl Minderheitsbeispiele hinzufügt als auch laute Mehrheitsbeispiele entfernt. Durch sorgfältiges Skalieren von Transaktionsbeträgen und -zeiten und das Verbergen sensibler Details hinter mathematischen Transformationen bereiten sie einen sauberen, datenschutzfreundlichen Datensatz vor, aus dem ein Computer lernen kann.

Aufbau eines Teams digitaler Betrugsjäger

Anstatt auf einen einzelnen Algorithmus zu setzen, trainieren die Autorinnen und Autoren 37 verschiedene Modelle aus klassischem Machine Learning, modernen Boosted Decision Trees und tiefen neuronalen Netzen. Dann entwerfen sie zwei spezielle „Stacking‑Ensembles“, die wie ein Gremium von Spezialisten agieren, deren Meinungen von einem abschließenden Schiedsrichter kombiniert werden. Im ersten Ensemble untersuchen ein schnelles baumbasiertes Modell, ein mustererkennendes bildähnliches Netzwerk und ein sequenzbewusstes Netzwerk jeweils dieselben Transaktionen. Deren Ausgaben werden in ein leistungsfähiges Booster‑Modell eingespeist, das lernt, wie viel Vertrauen jedem Spezialisten zu schenken ist. Das zweite Ensemble kombiniert mehrere Arten von baumbasierten Boostern und Wäldern in einer ähnlichen Schichtenstruktur. Beide Ensembles werden zuerst auf den ursprünglichen schiefen Daten und dann erneut auf der durch SMOTE und die hybride Methode erzeugten ausgeglichenen Version trainiert.

Figure 2
Figure 2.

Beinahe perfekte Erkennung – und was sie kostet

Auf den mit SMOTE erstellten ausgeglichenen Daten erreichen beide vorgeschlagenen Ensembles auffallend hohe Werte bei allen gängigen Erfolgsmaßen: In diesem Datensatz verpassen sie nahezu nie eine betrügerische Transaktion und lösen kaum Fehlalarme bei echten Transaktionen aus. Im Vergleich mit vielen Einzelmodellen und zuvor veröffentlichten Verfahren, die dieselben Daten nutzten, liegen ihre gestapelten Systeme beständig vorn. Sie messen auch die praktischen Aspekte: wie lange das Training dauert und wie viel Speicher benötigt wird. Das Ensemble, das stark auf tiefe neuronale Netze setzt, ist rechenintensiver, während das baumbasierte Ensemble ähnliche Genauigkeit mit deutlich geringerem Zeit‑ und Speicheraufwand liefert, was es für Echtzeitsysteme von Banken attraktiver macht.

Ein Blick in die Blackbox

Eine verbreitete Sorge bei fortgeschrittener KI ist, dass sie wie eine Blackbox wirkt: Selbst ihre Entwickler/innen wissen möglicherweise nicht, warum eine Transaktion als verdächtig markiert wurde. Um dem zu begegnen, nutzt die Studie zwei Erklärungswerkzeuge, die zeigen, welche versteckten Merkmale einer Transaktion für eine bestimmte Entscheidung und für das Gesamtsystem am wichtigsten sind. Visuelle Analysen enthüllen eine kleine Menge transformierter Variablen, die wiederholt Betrugsvorhersagen antreiben, während viele andere nur unterstützende Rollen spielen. Die Autorinnen und Autoren untersuchen auch, wo die Modelle noch Fehler machen, wie sicher sie bei Fehlentscheidungen sind und wie gut die Ergebnisse bestehen bleiben, wenn mehr Daten verwendet werden. Diese Prüfungen deuten darauf hin, dass die Modelle wirklich stabile Muster lernen und nicht nur die Trainingsdaten auswendig lernen.

Was das für die alltäglichen Karten‑Nutzenden bedeutet

Für Nicht‑Expertinnen und Nicht‑Experten ist die Botschaft beruhigend: Durch intelligentes Ausbalancieren der Daten und das Zusammenspiel mehrerer KI‑Ansätze können Banken Betrugserkenner bauen, die auf Benchmark‑Daten extrem genau und zugleich effizient genug im Betrieb sind. Ebenso wichtig ist, dass das System seine Entscheidungen erklären kann, was Institutionen hilft, ihm zu vertrauen und es zu verfeinern, und Regulierungsbehörden sein Verhalten besser nachvollziehen lässt. Zwar bleiben bei der Real‑Welt‑Einführung Herausforderungen – etwa sich ständig wandelnde Kriminaltaktiken und der Bedarf an schnellen, kontinuierlichen Updates – doch dieser hybride Ansatz bietet ein starkes Konzept dafür, Ihre Karte zu schützen, ohne Sie in Fehlalarmen zu ertränken.

Zitation: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4

Schlüsselwörter: Erkennung von Kreditkartenbetrug, Machine Learning, Deep Learning, Ensemble‑Modelle, unausgeglichene Daten