Clear Sky Science · es

Fusión de imágenes multivista mediante destilación de conocimiento para la clasificación de cuentas de vidrio antiguas excavadas en Japón

· Volver al índice

Cuentas como cápsulas del tiempo

Durante más de mil años, pequeñas cuentas de vidrio viajaron por rutas comerciales desde el Mediterráneo y la India hasta el archipiélago japonés. Hoy, estos fragmentos coloridos están entre los artefactos más comunes excavados en Japón—se han encontrado más de 600.000—pero determinar exactamente dónde se fabricaron suele exigir pruebas químicas lentas y costosas y el ojo entrenado de un especialista. Este estudio plantea una pregunta simple pero poderosa: ¿pueden fotografías ordinarias y la IA moderna sustituir al laboratorio, ayudando a los arqueólogos a rastrear el origen de estas cuentas de forma rápida y no invasiva?

Por qué importa el vidrio antiguo

Las cuentas de vidrio son más que joyería; son pistas sobre contactos a larga distancia a lo largo de Eurasia. Diferentes regiones empleaban mezclas distintas de materias primas y colorantes, generando “firmas” químicas que los especialistas usan para agrupar las cuentas en familias vinculadas a lugares como Asia Oriental, India, el sudeste asiático, Asia Central y el Mediterráneo. El trabajo tradicional de procedencia se basa en instrumentos que miden componentes químicos y en expertos que examinan formas, colores y marcas de fabricación con magnificación. Estos enfoques han revelado historias ricas sobre el comercio antiguo, pero son difíciles de escalar a cientos de miles de objetos frágiles conservados en museos y depósitos por todo Japón.

Figure 1
Figure 1.

De las mediciones de laboratorio a fotografías simples

Para romper este cuello de botella, los autores exploran un método que usa únicamente imágenes de las cuentas. En lugar de disolver una astilla de vidrio para el análisis, fotografían cada cuenta desde dos ángulos: una vista superior que revela el agujero en forma de anillo y los patrones de color generales, y una vista lateral que muestra el grosor y el perfil. Esta doble perspectiva imita cómo los expertos manejan los artefactos, girándolos en sus manos para captar cambios sutiles en la textura y la forma de la superficie. La meta es ambiciosa: con solo estas imágenes, ¿puede un ordenador asignar automáticamente cada cuenta a uno de los 16 grupos químicos y regionales establecidos que utilizan los arqueólogos?

Enseñar a las máquinas a ver como los expertos

El equipo recurre a un sistema híbrido de inteligencia artificial llamado MidNet. Combina dos estrategias líderes en análisis de imágenes. Una, conocida como red neuronal convolucional, es especialmente buena en captar detalles finos como pequeños poros, vetas de color o daños en la superficie. La otra, un transformer visual, está diseñado para ver la imagen en conjunto—cómo se relacionan colores y formas a lo largo de toda la cuenta. MidNet procesa ambas vistas (superior y lateral) a través de ambos tipos de modelos y luego fomenta que “estén de acuerdo” entre sí. Durante el entrenamiento, cada modelo aprende no solo de la etiqueta correcta sino también de las predicciones de su compañero y de la vista alternativa. Este intercambio reduce el riesgo de que el sistema se quede con peculiaridades de un ángulo o tipo de modelo en lugar de con rasgos visuales perdurables ligados al origen.

Trabajar con datos desiguales e imperfectos

El conjunto de datos detrás de MidNet consta de 3.434 imágenes de cuentas cuyas clases se establecieron previamente mediante un cuidadoso estudio experto y análisis químico. Algunos tipos de cuentas son abundantes, mientras que otros están representados por solo unos pocos ejemplos—un problema común en arqueología. Para evitar que la IA favorezca simplemente las clases más comunes, los investigadores usaron dos trucos. Primero, generaron imágenes de entrenamiento adicionales para los tipos muy raros usando una técnica moderna de síntesis de imágenes, creando variaciones creíbles sin tocar los artefactos. Segundo, distorsionaron deliberadamente las fotos de entrenamiento—cambios leves de color, recortes o escondiendo pequeños parches—para que el sistema sea menos sensible a daños menores o diferencias de iluminación. Luego evaluaron el rendimiento con un procedimiento riguroso de validación cruzada para ver qué tan bien generalizaría el método a cuentas no vistas.

Figure 2
Figure 2.

¿Qué tan bien funciona el sistema?

Cuando los investigadores compararon su híbrido MidNet con modelos de imágenes más estándar, encontraron que usar ambas vistas, superior y lateral, siempre ayudaba, confirmando que los dos ángulos capturan pistas complementarias. En términos de precisión bruta, MidNet igualó al mejor método competidor con un margen de solo unas pocas cuentas entre miles, pero mostró el comportamiento más estable a través de diferentes particiones de prueba. En otras palabras, su rendimiento varió menos de un experimento a otro, lo que indica que es menos sensible a qué cuentas específicas están en el conjunto de entrenamiento—una cualidad crucial al tratar con tipos de artefactos raros. El método aún tiene dificultades con ciertas categorías de aspecto muy similar que incluso los especialistas encuentran difíciles de distinguir, lo que sugiere un problema de “ultra-fina granularidad” donde las diferencias son casi imperceptibles solo en fotografías.

Qué significa esto para futuras excavaciones

Este estudio demuestra que la fotografía cuidadosa junto con un análisis avanzado de imágenes puede estimar de manera fiable dónde se fabricaron muchas cuentas de vidrio antiguas, sin tocar su química. Para los arqueólogos, eso abre la puerta a un ordenamiento rápido, económico y no destructivo de grandes colecciones, incluso en el campo o en pequeños museos que carecen de laboratorios. Aunque los casos complicados seguirán requiriendo juicio experto y pruebas químicas, un sistema como MidNet podría encargarse de la mayor parte de la clasificación rutinaria, destacar piezas inusuales y respaldar grandes archivos digitales que rastreen el movimiento del vidrio a través de continentes y siglos. En resumen, el trabajo muestra cómo la inteligencia artificial puede ayudar a reconstruir la historia humana, una diminuta cuenta a la vez.

Cita: Fukuchi, T., Tamura, T. & Fukunaga, K. Multi-view image fusion using knowledge distillation for classification of ancient glass beads excavated in Japan. npj Herit. Sci. 14, 41 (2026). https://doi.org/10.1038/s40494-026-02305-0

Palabras clave: arqueología, cuentas de vidrio, aprendizaje automático, clasificación basada en imágenes, patrimonio cultural