Clear Sky Science · zh

一种用于客户流失预测的混合深度学习框架,结合 RFM 与嵌入聚类

· 返回目录

为何留住网购客户至关重要

每一家在线商店都面临同样的问题:哪些客户在悄然流失,哪些还可能回归?及早识别可以让企业少花钱去争取新顾客,而把更多资源投入到留住现有顾客上。本研究提出了一种数据驱动的方法,通过把分散的点击与购买历史转化为清晰信号,及时发现有流失风险的顾客。

Figure 1. 如何通过分析网络购物模式将忠实客户与可能流失的客户区分开来。
Figure 1. 如何通过分析网络购物模式将忠实客户与可能流失的客户区分开来。

观察购买频率与消费额度

作者从一个许多营销人员都熟悉的简单观点出发:顾客在最近一次购买时间、购买频率和消费金额上存在差异。这三个指标,分别称为时效(recency)、频率(frequency)和货币价值(monetary value),勾勒出每位购物者的基本画像。经常购买、消费较多且近期有购买记录的人通常更忠诚;而长时间未购买、购买稀少且消费较低的人更可能流失。本研究以这三类信号为基础,辅以一些基于时间的统计量,作为后续分析的底层特征。

将有相似习惯的购物者分组

研究者并不把所有顾客视为单一群体,而是先将他们按行为分成若干段。研究采用一种深度学习技术,将每位顾客的购买画像压缩成紧凑的嵌入向量,再在该向量空间中自动形成聚类。这能发现用简单规则难以捕捉的模式,例如稳定常购者、季节性购物者与渐渐流失者之间的微妙差别。生成的聚类与实际业务含义相吻合:有些群体几乎全部为忠实顾客,而另一些群体则包含大量即将停止购买的用户。

Figure 2. 一个逐步模型如何将购物事件流转化为准确的流失预测。
Figure 2. 一个逐步模型如何将购物事件流转化为准确的流失预测。

教会系统追踪随时间变化的客户旅程

在完成分组后,研究把这些细分群体及其消费模式输入擅长处理序列的神经网络。这类网络最初用于阅读句子或处理声音信号,但在这里它们读取的是一连串的购物事件。它们学习个体活动在数周或数月内如何变化,以及这些变化通常会如何收敛——要么继续购买,要么沉寂。研究者在两个风格迥异的真实数据集上训练与测试模型:一个基于传统的购买记录,另一个由详细的点击与事件日志构成。

将新方法与传统工具进行比较

团队将这种混合方法与诸如逻辑回归和支持向量机等经典工具进行了对比。当数据已经整理良好时,简单模型表现不错,但在行为复杂或噪声较多时就难以胜任。相较之下,新框架先通过深度聚类重塑数据,然后用序列网络捕捉时间模式。在两个数据集中,该方案在保持查准与误报均衡的同时,达到了接近理想的准确率。消融研究表明,与仅使用序列模型相比,加入聚类步骤能明显提升性能。

这对在线企业意味着什么

对于非专业读者来说,主要结论是:更充分地利用人们何时以及如何购物的数据,能把日常日志转化为关于谁可能流失的早期预警。通过结合简单的消费摘要、智能的客户分组以及能随时间追踪行为的模型,该框架提供了一种更可靠的方式来标记高风险客户。企业随后可以把保留优惠、支持或内容投放到最需要关注的人群上,从而在不凭直觉判断的情况下提升客户忠诚度。

引用: Ibrahim, S., Tawfik, B.S., Makhlouf, M.A. et al. A novel hybrid deep learning framework for customer churn prediction using RFM and embedding clustering. Sci Rep 16, 16563 (2026). https://doi.org/10.1038/s41598-026-53220-0

关键词: 客户流失, 电子商务, 客户细分, 深度学习, RFM 分析