Clear Sky Science · es

Mejorar la detección de fraude con tarjetas de crédito mediante un enfoque híbrido con aprendizaje automático y profundo

· Volver al índice

Por qué esto importa para su bolsillo

Cada vez que acercas la tarjeta o compras en línea, comienza una carrera silenciosa: ¿podrán los sistemas de tu banco detectar a un ladrón antes de que desaparezca tu dinero? A medida que los pagos digitales se multiplican en todo el mundo, los delincuentes inventan constantemente nuevos trucos, y la seguridad basada en reglas simples (como “bloquear todas las transacciones superiores a 5.000 $ por la noche”) ya no basta. Este estudio muestra cómo combinar varios tipos de inteligencia artificial en un único “equipo de expertos” puede detectar casi todas las transacciones fraudulentas en una base de datos real muy utilizada, al tiempo que explica por qué el sistema tomó cada decisión.

Figure 1
Figure 1.

La creciente ola del engaño digital

El fraude con tarjetas de crédito es un gran negocio. Las pérdidas globales ya alcanzan decenas de miles de millones de dólares cada año y se espera que sigan aumentando con el crecimiento del comercio electrónico, la banca en línea y los pagos sin efectivo. La mayoría de las transacciones son perfectamente legítimas, pero una fracción diminuta es fraudulenta—en ocasiones menos de dos por cada mil. Ese desequilibrio complica el problema: un sistema puede parecer muy preciso simplemente clasificando casi todo como “normal” y aun así perder la mayor parte del fraude. Los autores se centran en este desequilibrio y en el hecho de que las tácticas de fraude cambian constantemente, lo que exige herramientas flexibles y basadas en datos en lugar de reglas rígidas escritas a mano.

Convertir el fraude raro en una señal aprendible

Los investigadores parten de un conjunto real de transacciones con tarjetas europeas recogidas durante dos días: alrededor de 285.000 pagos, de los cuales solo 492 son fraudulentos. Para evitar que el modelo se ahogue entre casos normales, utilizan una técnica que fabrica ejemplos adicionales realistas de la clase rara para que los datos queden más equilibrados. El método principal, llamado SMOTE, crea puntos sintéticos semejantes al fraude entre casos reales de fraude. También prueban un método híbrido más complejo que tanto añade ejemplos minoritarios como elimina ejemplos ruidosos de la mayoría. Mediante el escalado cuidadoso de importes y tiempos de transacción y ocultando detalles sensibles tras transformaciones matemáticas, preparan un conjunto de datos limpio y respetuoso con la privacidad del que puede aprender un ordenador.

Construir un equipo de cazadores digitales de fraude

En lugar de apostar por un único algoritmo, los autores entrenan 37 modelos distintos procedentes del aprendizaje automático clásico, los modernos árboles potentes (boosting) y redes neuronales profundas. Luego diseñan dos “ensambles apilados” especiales, que actúan como un panel de especialistas cuyas opiniones combina un árbitro final. En el primer ensamble, un modelo de árboles rápido, una red estilo imagen que detecta patrones y una red sensible a secuencias estudian las mismas transacciones. Sus salidas se alimentan luego a un potente modelo booster que aprende cuánto confiar en cada especialista. El segundo ensamble combina varios tipos de boosters y bosques basados en árboles en una estructura por capas similar. Ambos ensambles se entrenan primero con los datos originales desequilibrados y después con la versión equilibrada producida por SMOTE y el método híbrido.

Figure 2
Figure 2.

Detección casi perfecta y su coste

En los datos equilibrados creados con SMOTE, ambos ensambles propuestos alcanzan puntuaciones notablemente altas en todas las medidas estándar de éxito: casi nunca fallan al detectar una transacción fraudulenta y casi nunca generan una falsa alarma sobre una transacción genuina en este conjunto de datos. Cuando los autores comparan con muchos modelos individuales y con métodos publicados previamente que usaron los mismos datos, sus sistemas apilados consistentemente quedan en la cima. También miden el aspecto práctico: cuánto tarda el entrenamiento y cuánta memoria se necesita. El ensamble que se apoya en redes neuronales profundas es más costoso computacionalmente, mientras que el ensamble centrado en árboles ofrece una precisión similar con demandas de tiempo y memoria sustancialmente menores, lo que lo hace más atractivo para sistemas bancarios en tiempo real.

Ver dentro de la caja negra

Una preocupación común con la IA avanzada es que actúa como una caja negra: ni siquiera sus diseñadores pueden saber por qué marcó tu compra como sospechosa. Para abordarlo, el estudio usa dos herramientas de explicación que muestran qué características transformadas de una transacción importan más para una decisión dada y para el sistema en su conjunto. Los análisis visuales revelan un pequeño conjunto de variables transformadas que repetidamente impulsan las predicciones de fraude, mientras que muchas otras solo juegan un papel secundario. Los autores también inspeccionan dónde los modelos aún cometen errores, cuán confiados están cuando se equivocan y qué tan bien se mantienen los resultados al usar más datos. Estas comprobaciones sugieren que los modelos están aprendiendo patrones estables de manera genuina en lugar de simplemente memorizar los datos de entrenamiento.

Qué significa esto para los usuarios habituales de tarjetas

Para los no expertos, la conclusión es tranquilizadora: equilibrando los datos de forma inteligente y permitiendo que varios enfoques de IA trabajen juntos, los bancos pueden construir detectores de fraude que son a la vez extremadamente precisos en datos de referencia y razonablemente eficientes en su ejecución. Igual de importante, el sistema puede explicar sus decisiones, lo que ayuda a las instituciones a confiar en él y a refinarlo, y ayuda a los reguladores a entender su comportamiento. Aunque el despliegue en el mundo real aún enfrenta retos—como las tácticas criminales en constante evolución y la necesidad de actualizaciones rápidas y continuas—este enfoque híbrido ofrece un sólido plan para mantener tu tarjeta segura sin inundarte de falsas alarmas.

Cita: Gamal, N., Younis, E.M.G. & Makram, W.M. Enhancing credit card fraud detection with a hybrid approach using machine and deep learning. Sci Rep 16, 10944 (2026). https://doi.org/10.1038/s41598-026-42891-4

Palabras clave: detección de fraude con tarjetas de crédito, aprendizaje automático, aprendizaje profundo, modelos ensamblados, datos desequilibrados