Clear Sky Science · de

Neuronales Netzwerk zur Verbesserung der Abwanderungsvorhersage durch kategoriale Kodierung und Standard-Skalierung

· Zurück zur Übersicht

Warum Kundenbindung wichtig ist

Wenn Sie einen Handytarif kündigen, ein Bankkonto schließen oder ein Abonnement nicht mehr nutzen, gelten Sie für Unternehmen als „abgewanderter“ Kunde. Einen neuen Kunden an Stelle von Ihnen zu gewinnen ist deutlich teurer, als Sie zu behalten; deshalb wollen Firmen frühzeitig Warnsignale erkennen, dass ein Kunde gehen könnte. Diese Studie untersucht, wie ein sorgfältig gestaltetes neuronales Netzwerk – eine Form künstlicher Intelligenz – genauer vorhersagen kann, welche Bankkunden wahrscheinlich abwandern, und Firmen so hilft, ihr Budget für Kundenbindung gezielter einzusetzen.

Rohdaten aus Bankunterlagen in Warnsignale verwandeln

Die Forschenden arbeiteten mit einem öffentlichen Datensatz von etwa 10.000 Bankkunden, die jeweils durch ein Dutzend Informationen beschrieben sind, etwa Alter, Land, Kontostand, Dauer der Kundenbeziehung sowie Angaben dazu, ob sie eine Kreditkarte besitzen oder aktive Nutzer sind. Eine zentrale Herausforderung ist, dass diese Informationen in verschiedenen Formen vorliegen: manche Werte sind Zahlen (z. B. Gehalt), andere Kategorien (z. B. Land), und der Anteil der tatsächlich Abwandernden ist relativ klein. Das Team konzentrierte sich auf zwei oft übersehene, aber entscheidende Schritte – wie kategoriale Informationen in Zahlen umzuwandeln (kategoriale Kodierung) und wie numerische Felder vergleichbar zu skalieren (Standard-Skalierung) –, bevor alles in ein neuronales Netzwerk eingespeist wurde.

Figure 1
Figure 1.

Bereinigung und Ausbalancierung der Daten

Um faire Vorhersagen zu treffen, mussten die Daten zunächst bereinigt werden. Fehlende Werte und auffällige Ausreißer wurden behandelt, und Länder sowie andere kategoriale Angaben wurden mittels One-Hot-Encoding transformiert, das jede Kategorie als eine Reihe einfacher Ja/Nein-Indikatoren darstellt statt als willkürliche numerische Labels. Gleichzeitig wurden numerische Messwerte wie Kredit-Score und Kontostand standardisiert, damit kein einzelnes großwertiges Feld den Lernprozess dominiert. Da abwandernde Kunden seltener sind als bleibende, passte das Team außerdem das Trainingsverfahren so an, dass Fehlklassifikationen bei Abwandernden stärker gewichteten als Fehler bei Bleibenden, wodurch das Netzwerk angeregt wurde, der Minderheitsgruppe mehr Aufmerksamkeit zu schenken.

Das Netzwerk darauf trainieren, gefährdete Kunden zu erkennen

Auf den vorbereiteten Daten bauten die Autorinnen und Autoren ein mehrschichtiges neuronales Netzwerk auf, das rund 30 Eingangsmerkmale über mehrere versteckte Schichten verarbeitet. Jede Schicht bildet gewichtete Kombinationen der Eingaben ab, gefolgt von einer einfachen nichtlinearen Funktion, sodass das Modell subtile Wechselwirkungen erfassen kann – etwa wie Kontostand, Dauer der Kundenbeziehung und Aktivitätsstatus gemeinsam die Abwanderungswahrscheinlichkeit beeinflussen. Das Training erfolgte in einem rigorosen Cross-Validation-Rahmen: Der Datensatz wurde wiederholt in Trainings- und Testsegmente aufgeteilt, sodass die Leistung des Modells widerspiegelt, wie gut es auf neue Kunden generalisiert und nicht nur bereits gesehene Fälle auswendig lernt. Die Ausgabe des Systems ist eine Abwanderungswahrscheinlichkeit für jeden Kunden – im Grunde ein Risiko-Score, auf den eine Bank reagieren kann.

Figure 2
Figure 2.

Wie gut das Modell in der Praxis funktioniert

Das neuronale Netzwerk erzielte eine hohe Gesamtgenauigkeit und vor allem eine sehr hohe Präzision: Mehr als vier von fünf Kunden, die als wahrscheinliche Abwanderer markiert wurden, waren tatsächlich gefährdet. Das bedeutet, dass Banken teure Rückgewinnungsangebote mit Zuversicht auf eine relativ kleine Gruppe konzentrieren können, statt Geld an viele Kunden zu verschwenden, die ohnehin geblieben wären. Obwohl das Modell einige Abwanderer verpasst (seine Sensitivität ist moderat), kennzeichnet es selten loyale Kunden fälschlich als Abwanderungsrisiko, was wichtig ist, wenn Anreize und Kontaktmaßnahmen teuer sind. Im Vergleich mit einer Reihe anderer gängiger Methoden – wie Random Forests, Gradient Boosting und logistischer Regression – erreichte das vorgeschlagene neuronale Netzwerk vergleichbare oder bessere Werte bei wichtigen Rang- und Diskriminierungsmaßen und zeichnete sich besonders darin aus, Fehlalarme zu minimieren.

Was Abwanderung antreibt und wie Banken reagieren können

Über reine Scores hinaus untersuchten die Autorinnen und Autoren, auf welche Faktoren sich das Modell am stärksten stützte. Kontostand und der Status als „aktives Mitglied“ erwiesen sich als führende Signale; auch Kreditkartenbesitz, Land und Alter spielten wichtige Rollen. Anders gesagt: Hinweise auf finanzielle Einbindung und tägliche Aktivität sind starke Indikatoren für Loyalität. Das Team prüfte außerdem, wie sich das Modell in verschiedenen Ländern und Geschlechtern verhält und wie gut seine Risiko-Scores mit tatsächlichen Abwanderungsraten übereinstimmen. Sie zeigten, dass die Wahrscheinlichkeiten für Kunden mit geringem bis mittlerem Risiko gut kalibriert sind und dass das Modell verwendet werden kann, um zielgerichtete Kampagnen zu entwerfen, die den Gewinn maximieren: Die Fokussierung auf die obersten 10–30 % der Hochrisiko-Kunden bringt den größten finanziellen Ertrag; darüber hinaus werden zusätzliche Maßnahmen teurer als der dadurch eingesparte Betrag.

Was das für alltägliche Dienstleistungen bedeutet

Einfach ausgedrückt zeigt die Studie, dass sorgfältige Datenaufbereitung – insbesondere die Umwandlung von Kategorien in Zahlen und die Vereinheitlichung der Skalen aller Merkmale – neuronale Netze deutlich verlässlicher für die Vorhersage macht, wer einen Dienst verlassen wird. Das resultierende Modell erzielt nicht nur auf dem Papier gute Werte; es bietet Banken und ähnlichen Unternehmen eine praktische Möglichkeit, tatsächlich gefährdete Kunden zu identifizieren und gleichzeitig verschwenderische Kampagnen zu vermeiden. Indem die einflussreichsten Signale der Abwanderung hervorgehoben und die Verbindung zwischen Vorhersagen und Profit gezeigt werden, verschiebt diese Arbeit die Abwanderungsvorhersage von einer rein technischen Übung hin zu einem Entscheidungsinstrument, das Unternehmen helfen kann, ihre Kunden länger zu halten.

Zitation: Bhattacharjee, B., Madhu, U., Guha, S.K. et al. Neural network approach enhancing churn prediction with categorical encoding and standard scaling. Sci Rep 16, 6274 (2026). https://doi.org/10.1038/s41598-026-37407-z

Schlüsselwörter: Kundenabwanderung, Neurale Netze, Bankanalytik, Maschinelles Lernen, Kundenbindung