Clear Sky Science · de

Ein neuartiges hybrides Deep-Learning-Framework zur Vorhersage von Kundenabwanderung mithilfe von RFM und Embedding-Clustering

· Zurück zur Übersicht

Warum es wichtig ist, Online-Shopper zu halten

Jeder Online-Shop steht vor derselben Frage: Welche Kunden entfernen sich stillschweigend, und welche werden wahrscheinlich zurückkehren? Frühzeitig zu wissen, wer gefährdet ist, erlaubt Unternehmen, weniger Geld für die Jagd nach neuen Käufern auszugeben und mehr in die Bindung der vorhandenen Kunden zu investieren. Diese Studie stellt eine datengetriebene Methode vor, mit der gefährdete Kunden identifiziert werden können, indem unübersichtliche Klick- und Kaufverläufe in klare Signale verwandelt werden, die darauf hinweisen, dass eine Person bald keine Käufe mehr tätigen wird.

Figure 1. Wie die Analyse von Online-Einkaufsmustern loyale Kunden von solchen unterscheidet, die wahrscheinlich abspringen.
Figure 1. Wie die Analyse von Online-Einkaufsmustern loyale Kunden von solchen unterscheidet, die wahrscheinlich abspringen.

Betrachtung, wie oft und wie viel Menschen kaufen

Die Autoren beginnen mit einer einfachen Idee, die vielen Marketern vertraut ist: Kunden unterscheiden sich darin, wie kürzlich sie gekauft haben, wie häufig sie kaufen und wie viel sie ausgeben. Diese drei Werte — Recency, Frequency und Monetary Value — zeichnen ein grundlegendes Bild jedes Käufers. Personen, die häufig kaufen, mehr ausgeben und kürzlich eingekauft haben, sind meist loyal. Wer lange nichts gekauft hat, selten kauft und wenig ausgibt, ist eher abwanderungsgefährdet. Die Studie nutzt diese drei Signale sowie einige zusätzliche zeitbezogene Statistiken als Grundlage für alle weiteren Analysen.

Kunden mit ähnlichen Gewohnheiten gruppieren

Anstatt alle Kunden als eine homogene Masse zu behandeln, gruppieren die Forschenden sie zunächst in verhaltensbasierte Segmente. Sie verwenden eine Deep-Learning-Technik, die das Kaufprofil jedes Kunden in einen kompakten Code komprimiert und dann automatisch Cluster in diesem Code-Raum bildet. Dadurch werden Muster entdeckt, die mit einfachen Regeln schwer zu erkennen sind, etwa feine Unterschiede zwischen konstanten Stammkäufern, saisonalen Käufern und solchen, die sich allmählich entfernen. Die resultierenden Cluster haben reale geschäftliche Bedeutungen: Einige Gruppen bestehen nahezu ausschließlich aus loyalen Kunden, während andere einen hohen Anteil an Personen enthalten, die kurz davorstehen, nicht mehr zu kaufen.

Figure 2. Wie ein schrittweises Modell Stromdaten von Einkaufsvorgängen in präzise Vorhersagen darüber verwandelt, wer abwandern wird.
Figure 2. Wie ein schrittweises Modell Stromdaten von Einkaufsvorgängen in präzise Vorhersagen darüber verwandelt, wer abwandern wird.

Dem System beibringen, Kundenverläufe über die Zeit zu verfolgen

Nachem die Kunden gruppiert wurden, speist die Studie diese Segmente zusammen mit den Ausgabemustern in neuronale Netze, die gut mit Sequenzen umgehen können. Diese Netzwerke wurden ursprünglich zum Lesen von Sätzen oder zur Verarbeitung von Ton entwickelt, lesen hier aber stattdessen Ströme von Einkaufsereignissen. Sie lernen, wie sich die Aktivität einer Person über Wochen oder Monate verändert und wie solche Veränderungen typischerweise enden — entweder in weiterem Kaufverhalten oder in Stille. Die Forschenden trainieren und testen ihre Modelle an zwei sehr unterschiedlichen realen Datensätzen, einem aus traditionellen Kaufaufzeichnungen und einem anderen, das aus detaillierten Klick- und Ereignisprotokollen aufgebaut ist.

Vergleich neuer Methoden mit etablierten Werkzeugen

Das Team vergleicht anschließend seinen hybriden Ansatz mit Standardmethoden wie logistischer Regression und Support Vector Machines. Einfache Modelle liefern gute Ergebnisse, wenn die Daten bereits sauber sind, tun sich aber schwer, wenn das Verhalten komplex oder verrauscht ist. Dagegen formt das neue Framework die Daten zunächst durch Deep Clustering um und erfasst anschließend zeitliche Muster mit sequenziellen Netzen. Über beide Datensätze hinweg erreicht dieses Setup eine nahezu perfekte Genauigkeit und bleibt dabei ausgewogen zwischen dem Erkennen von Abwanderern und dem Vermeiden zu vieler Fehlalarme. Eine Ablationsstudie zeigt, dass das Hinzufügen des Clustering-Schritts die Leistung gegenüber der reinen Nutzung der Sequenzmodelle deutlich verbessert.

Was das für Online-Unternehmen bedeutet

Für Nicht-Spezialisten lautet die Hauptbotschaft: Eine reichhaltigere Nutzung von Daten darüber, wann und wie Menschen einkaufen, kann routinemäßige Protokolle in Frühwarnungen verwandeln, wer wahrscheinlich abspringt. Durch die Kombination einfacher Ausgabenzusammenfassungen, intelligenter Kundengruppierung und Modelle, die Verhalten über die Zeit verfolgen, bietet das Framework eine verlässlichere Methode, gefährdete Kunden zu kennzeichnen. Unternehmen können so Bindungsangebote, Support oder Inhalte gezielt auf die Personen fokussieren, die am dringendsten Aufmerksamkeit benötigen, und die Loyalität verbessern, ohne zu raten oder sich nur auf Bauchgefühl zu verlassen.

Zitation: Ibrahim, S., Tawfik, B.S., Makhlouf, M.A. et al. A novel hybrid deep learning framework for customer churn prediction using RFM and embedding clustering. Sci Rep 16, 16563 (2026). https://doi.org/10.1038/s41598-026-53220-0

Schlüsselwörter: Kundenabwanderung, E-Commerce, Kundensegmentierung, Deep Learning, RFM-Analyse