Clear Sky Science · es

Un nuevo marco híbrido de aprendizaje profundo para la predicción de abandono de clientes usando RFM y agrupación de embeddings

· Volver al índice

Por qué importa retener a los compradores online

Cada tienda en línea se enfrenta a la misma pregunta: ¿qué clientes se están alejando silenciosamente y cuáles volverán probablemente? Detectarlo temprano permite a las empresas gastar menos persiguiendo nuevos compradores y más en conservar a los que ya tienen. Este estudio presenta una forma basada en datos para identificar clientes en riesgo convirtiendo historiales desordenados de clics y compras en señales claras de que una persona está a punto de dejar de comprar.

Figure 1. Cómo el análisis de los patrones de compra online puede separar a los clientes leales de quienes probablemente se marchen.
Figure 1. Cómo el análisis de los patrones de compra online puede separar a los clientes leales de quienes probablemente se marchen.

Mirar con qué frecuencia y cuánto compran las personas

Los autores parten de una idea simple que muchos responsables de marketing ya conocen: los clientes difieren en cuán recientemente compraron, con qué frecuencia compran y cuánto gastan. Estos tres números, llamados recencia, frecuencia y valor monetario, dibujan un retrato básico de cada comprador. Las personas que compran con frecuencia, gastan más y han comprado recientemente suelen ser leales. Aquellas que no han comprado durante mucho tiempo, compran raramente y gastan poco tienen más probabilidades de marcharse. El estudio usa estas tres señales, además de algunas estadísticas adicionales basadas en el tiempo, como base para todo el análisis posterior.

Agrupar compradores con hábitos similares

En lugar de tratar a todos los clientes como una misma masa, los investigadores primero los agrupan en segmentos basados en el comportamiento. Utilizan una técnica de aprendizaje profundo que comprime el perfil de compra de cada cliente en un código compacto y luego forma automáticamente clústeres en ese espacio de códigos. Esto encuentra patrones difíciles de ver con reglas simples, como diferencias sutiles entre compradores regulares y constantes, compradores estacionales y aquellos que se están alejando. Los clústeres resultantes se alinean con significados comerciales reales: algunos grupos son casi exclusivamente clientes leales, mientras que otros contienen una alta proporción de personas que están a punto de dejar de comprar.

Figure 2. Cómo un modelo paso a paso convierte flujos de eventos de compra en predicciones precisas de quién abandonará.
Figure 2. Cómo un modelo paso a paso convierte flujos de eventos de compra en predicciones precisas de quién abandonará.

Enseñar al sistema a seguir los recorridos de los clientes en el tiempo

Tras agrupar a los clientes, el estudio alimenta esos segmentos, junto con los patrones de gasto, a redes neuronales adecuadas para manejar secuencias. Estas redes se diseñaron originalmente para leer oraciones o sonido, pero aquí leen flujos de eventos de compra. Aprenden cómo cambia la actividad de una persona a lo largo de semanas o meses y cómo suelen terminar esos cambios, ya sea en compras continuadas o en silencio. Los investigadores entrenan y prueban sus modelos en dos conjuntos de datos del mundo real muy diferentes, uno formado por registros tradicionales de compra y otro construido a partir de registros detallados de clics y eventos.

Comparar métodos nuevos con herramientas tradicionales

El equipo compara entonces su enfoque híbrido con herramientas estándar como regresión logística y máquinas de soporte vectorial. Los modelos simples funcionan bien cuando los datos ya están ordenados, pero se esfuerzan cuando el comportamiento es complejo o ruidoso. En contraste, el nuevo marco primero reconfigura los datos mediante clustering profundo y luego captura los patrones temporales con redes secuenciales. En ambos conjuntos de datos, esta configuración alcanza una precisión cercana a la perfecta manteniendo el equilibrio entre detectar a los que abandonan y no generar demasiadas falsas alarmas. Un estudio de ablación muestra que añadir el paso de clustering mejora claramente el rendimiento frente a usar solo los modelos secuenciales.

Qué significa esto para los negocios online

Para un público no especializado, el mensaje principal es que un uso más completo de los datos sobre cuándo y cómo compran las personas puede convertir registros rutinarios en alertas tempranas sobre quiénes están a punto de marcharse. Combinando resúmenes simples de gasto, agrupación inteligente de clientes y modelos que siguen el comportamiento a lo largo del tiempo, el marco ofrece una forma más fiable de señalar a los clientes en riesgo. Las empresas pueden entonces dirigir ofertas de retención, soporte o contenido a las personas que más lo necesitan, mejorando la fidelidad sin adivinar ni fiarse solo de la intuición.

Cita: Ibrahim, S., Tawfik, B.S., Makhlouf, M.A. et al. A novel hybrid deep learning framework for customer churn prediction using RFM and embedding clustering. Sci Rep 16, 16563 (2026). https://doi.org/10.1038/s41598-026-53220-0

Palabras clave: abandono de clientes, comercio electrónico, segmentación de clientes, aprendizaje profundo, análisis RFM