Clear Sky Science · es

MobileMamba mejorado con aprendizaje contrastivo para detección de defectos industriales en tiempo real en dispositivos edge

· Volver al índice

Ojos más inteligentes para el metal de fábrica

Desde coches y aviones hasta puentes y electrodomésticos, la vida moderna depende de piezas metálicas que no deben agrietarse, descascarillarse ni picarse. Hoy en día, muchas fábricas siguen confiando en ordenadores voluminosos o incluso en inspectores humanos para encontrar pequeños defectos en líneas de producción de alta velocidad. Este artículo presenta un nuevo tipo de sistema compacto de inteligencia artificial (IA) que puede detectar fallos muy pequeños en superficies metálicas de forma rápida y precisa, incluso cuando se ejecuta en dispositivos de bajo consumo montados directamente junto a las máquinas que fabrican esas piezas.

Por qué las grietas diminutas son un gran problema

Las láminas y perfiles metálicos pasan por etapas de soldadura, colada y corte antes de convertirse en productos terminados. En ese proceso pueden aparecer grietas, agujeros, arañazos y otros defectos superficiales. Los defectos pasados por alto pueden acortar la vida útil de una pieza o incluso provocar fallos peligrosos. Los sistemas de visión por ordenador basados en aprendizaje profundo han empezado a automatizar esta inspección, pero muchos de los métodos más precisos son demasiado lentos o pesados para ejecutarse en pequeños y económicos dispositivos “edge” que las fábricas prefieren instalar en la línea. Los modelos rápidos existentes, a su vez, a menudo tienen dificultades con defectos muy pequeños o de bajo contraste y pueden confundirse con fondos ruidosos o con patrones complejos.

Figure 1
Figure 1.

Un inspector digital más ligero y agudo

Los autores presentan MobileMamba, una nueva red de detección ligera diseñada específicamente para la inspección industrial de metales. Se basa en la popular familia de modelos de detección YOLO, pero reemplaza partes clave de la arquitectura por componentes que son a la vez más eficientes y mejores para ver el conjunto de la imagen. Una idea central es usar una técnica reciente de modelado de secuencias llamada Mamba, que puede capturar patrones de largo alcance en una imagen con mucho menos cómputo que las redes basadas en atención. Envuelto en un bloque constructivo esbelto que usa convoluciones depthwise, MobileMamba aprende a combinar detalles locales finos, como una grieta capilar, con un contexto más amplio a lo largo de la lámina metálica, todo ello manteniendo reducidos el tamaño del modelo y sus necesidades energéticas.

Enseñar al modelo lo que realmente importa

Las imágenes reales de inspección están dominadas por regiones normales sin defectos, por lo que un modelo puede volverse fácilmente sesgado y catalogar todo como “OK”. Para contrarrestarlo, los investigadores añaden un objetivo de entrenamiento auxiliar basado en aprendizaje contrastivo. Durante el entrenamiento, el sistema compara continuamente los patrones de características de las regiones con defectos (primer plano) con los de las áreas limpias de fondo, y también contrapone las cajas de defecto correctas con predicciones incorrectas. De forma crucial, no trata todos los ejemplos de fondo por igual: encuentra automáticamente las muestras negativas “difíciles” —parches de fondo que se parecen más a los defectos— y obliga al modelo a prestar atención extra para distinguirlos. Este término de pérdida adicional se usa solo durante el aprendizaje y desaparece en la operación, por lo que no ralentiza el uso en tiempo real.

Figure 2
Figure 2.

Demostrar el rendimiento con datos reales de fábrica

El equipo probó su enfoque en tres conjuntos de datos industriales ampliamente usados de superficies de acero y aluminio, que contienen diversos tipos de defectos como grietas, inclusiones y picaduras por laminado. En comparación con varios detectores ligeros modernos, el nuevo método alcanzó de forma consistente puntuaciones de detección más altas mientras empleaba menos parámetros y menos cómputo. En los tres conjuntos, incrementó la precisión en alrededor de tres puntos porcentuales respecto a modelos basados en YOLO de tamaño similar. Los autores construyeron además una versión “nano” aún más pequeña de MobileMamba y la desplegaron en una placa edge económica NVIDIA Jetson Nano. Incluso con tamaños de imagen reducidos, esta versión alcanzó velocidades de inspección en tiempo real de al menos 25 fotogramas por segundo, superando en precisión a otros detectores orientados al edge.

Qué significa esto para las fábricas reales

Para los no especialistas, el resultado principal es sencillo: este trabajo ofrece un inspector IA que es a la vez rápido y lo bastante austero para ordenadores industriales pequeños, pero lo suficientemente preciso como para detectar defectos finos y difíciles de ver en superficies metálicas. Al rediseñar cómo la red recopila información a lo largo de la imagen y entrenarla para que se concentre en los parecidos de fondo más engañosos, los autores demuestran que las fábricas no tienen que elegir entre velocidad y fiabilidad. Con refinamientos adicionales, como una compresión más inteligente y la combinación de imágenes ordinarias con vistas térmicas o de rayos X, enfoques como MobileMamba podrían ayudar a llevar un control de calidad más seguro y consistente a una amplia gama de líneas de fabricación.

Cita: Huang, J., Ariffin, S.A., Yang, Q. et al. Contrastive learning enhanced MobileMamba for real time industrial defect detection on edge devices. Sci Rep 16, 5096 (2026). https://doi.org/10.1038/s41598-026-35515-4

Palabras clave: detección de defectos en metal, IA en el edge, inspección industrial, redes neuronales ligeras, aprendizaje contrastivo