Clear Sky Science · es

InSwAV: agrupación de características mejorada por involución y asignaciones intercambiadas para la clasificación de imágenes microscópicas de reliquias de porcelana

2026-02-24 · Volver al índice

Por qué la porcelana rota importa hoy

En China y más allá, las excavaciones arqueológicas sacan a la luz montones de porcelana hecha añicos. Cada fragmento conserva pistas sobre cómo vivían las personas, cómo comerciaban y cómo dominaban la cocción a altas temperaturas hace siglos. Sin embargo, clasificar y emparejar estas innumerables piezas es un trabajo lento que requiere especialistas. Este estudio presenta un nuevo enfoque de inteligencia artificial, llamado InSwAV, que aprende a partir de imágenes microscópicas de las superficies de la porcelana para agrupar automáticamente los fragmentos por tipo. Una clasificación más rápida y fiable podría acelerar de forma notable los trabajos de restauración y profundizar nuestro conocimiento del patrimonio cultural.

Ver la historia en pequeñas burbujas

Para el ojo desnudo, muchas piezas de porcelana resultan confusas y parecidas: esmaltes blancos o verde pálido, motivos gastados y bordes dañados. Bajo el microscopio, sin embargo, aparece otro mundo. Pequeñas burbujas atrapadas en el esmalte registran detalles de la arcilla, la receta del vidriado, la temperatura de cocción e incluso las prácticas de hornos o talleres concretos. Investigaciones previas mostraron que el tamaño, la forma y la distribución de estas burbujas varían según centros de producción y periodos, lo que las convierte en huellas digitales potentes para la identificación y la datación. Pero extraer e interpretar estos patrones sutiles a mano o con herramientas de procesamiento de imagen tradicionales exige mucho trabajo y es sensible al ruido.

Dejar que el ordenador se enseñe a sí mismo

Un obstáculo importante en este campo es la escasez de datos etiquetados: los especialistas solo pueden anotar un número limitado de micrografías, y algunos tipos de fragmentos son raros. En lugar de depender de miles de ejemplos etiquetados por expertos, los autores recurren al aprendizaje auto‑supervisado, en el que una red neuronal se entrena para descubrir estructura en los datos por sí misma. Construyen el conjunto de datos Porcelain Relic Microscopic Image (PRMI), que contiene 7425 imágenes de alta magnificación de cinco categorías de porcelana. Para cada micrografía original, el sistema crea múltiples versiones alteradas mediante recortes, volteos, ligeros cambios de color y desenfoque. Estas “vistas” muestran el mismo material de formas distintas, incentivando al ordenador a concentrarse en características estables y significativas en lugar de detalles superficiales.

Una forma más inteligente de detectar patrones

El núcleo del método es InSwAV, una red construida alrededor de un extractor de características personalizado llamado ResInv. Las redes de imagen estándar usan filtros convolucionales fijos que se desplazan por la imagen. ResInv, en cambio, combina estos con operaciones de “involución” que ajustan su comportamiento según la posición, captando mejor las formas irregulares y multiescala de las burbujas del esmalte y las grietas. Una vez que ResInv convierte cada imagen en una firma compacta, InSwAV no compara imágenes individuales directamente. En su lugar, las asigna a un conjunto de “prototipos” aprendidos, o centros de clúster, y luego comprueba si las distintas vistas aumentadas del mismo fragmento caen en clústeres compatibles. Un paso matemático de balance evita que el modelo se limite a agrupar todo en solo unos pocos grupos, obligándolo a descubrir una estructura real y más fina.

Precisión, velocidad y lo que revelan

En el conjunto PRMI, InSwAV distingue correctamente las cinco categorías de porcelana en el 96,2% de los casos, superando claramente a varios métodos auto‑supervisados punteros e incluso a una sólida referencia supervisada que contaba con etiquetas. También se entrena mucho más rápido, alcanzando alta precisión tras solo unas horas en hardware gráfico moderno. Visualizaciones de la actividad interna de la red muestran que ResInv se concentra en las burbujas y los detalles microestructurales clave, mientras que una arquitectura estándar tiende a distraerse con regiones de fondo. El enfoque también es robusto frente a distintas elecciones del número de clústeres que usa el modelo, lo que sugiere que puede adaptarse bien a nuevos conjuntos de datos.

Qué significa esto para los vasos rotos y más allá

En términos sencillos, el estudio demuestra que un ordenador puede aprender a diferenciar reliquias de porcelana distintas estudiando sus “paisajes de burbujas” microscópicos, incluso cuando los expertos proporcionan pocas etiquetas. Esta capacidad podría ayudar a museos y arqueólogos a clasificar grandes colecciones más rápido, emparejar fragmentos para la reconstrucción virtual y apoyar estudios sobre tecnología de hornos y redes comerciales. Los autores planean ampliar su conjunto de datos, probar el método en colecciones de imágenes más amplias y optimizar aún más el modelo para su uso en campo. A medida que estas herramientas maduren, prometen convertir fragmentos frágiles, que requieren mucho tiempo, en registros ricos y rápidamente accesibles del pasado.

Cita: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Palabras clave: reliquias de porcelana, imágenes microscópicas, aprendizaje auto‑supervisado, restauración del patrimonio cultural, clasificación de imágenes