Clear Sky Science · fr

InSwAV : regroupement de caractéristiques amélioré par involution et affectations échangées pour la classification d’images microscopiques de reliques en porcelaine

· Retour à l’index

Pourquoi la porcelaine cassée compte pour le présent

En Chine et au‑delà, les fouilles archéologiques mettent au jour des montagnes de porcelaine brisée. Chaque fragment porte des indices sur le mode de vie, les échanges et la maîtrise des cuissons à haute température des siècles passés. Pourtant, trier et assembler ces innombrables éclats reste un travail lent et réservé aux experts. Cette étude présente une nouvelle approche d’intelligence artificielle, appelée InSwAV, qui apprend à partir d’images microscopiques des surfaces de porcelaine pour regrouper automatiquement les fragments par type. Une classification plus rapide et plus fiable pourrait accélérer considérablement les travaux de restauration et approfondir notre compréhension du patrimoine culturel.

Figure 1
Figure 1.

Voir l’histoire dans de minuscules bulles

À l’œil nu, de nombreuses pièces de porcelaine se ressemblent : glaçures blanches ou vert pâle, motifs usés et bords endommagés. Au microscope, pourtant, un autre monde apparaît. De minuscules bulles piégées dans l’émail enregistrent des détails sur l’argile, la recette de la glaçure, la température de cuisson et même les habitudes de fours ou d’ateliers individuels. Des travaux antérieurs ont montré que la taille, la forme et la distribution de ces bulles varient selon les centres de production et les périodes, faisant d’elles des empreintes puissantes pour l’identification et la datation. Mais extraire et interpréter ces motifs subtils à la main ou avec des outils traditionnels de traitement d’image est laborieux et sensible au bruit.

Laisser l’ordinateur s’enseigner

Un obstacle majeur dans ce domaine est le manque de données annotées : les spécialistes ne peuvent étiqueter qu’un nombre limité d’images microscopiques, et certains types de fragments sont rares. Plutôt que de s’appuyer sur des milliers d’exemples annotés par des experts, les auteurs recourent à l’apprentissage auto‑supervisé, où un réseau neuronal apprend à découvrir la structure des données par lui‑même. Ils constituent le jeu de données Porcelain Relic Microscopic Image (PRMI), contenant 7425 images à fort grossissement issues de cinq catégories de porcelaine. Pour chaque micrographie d’origine, le système crée plusieurs versions altérées par recadrage, retournement, légères modifications de couleur et flou. Ces « vues » montrent le même matériau sous différents aspects, incitant l’ordinateur à se concentrer sur des caractéristiques stables et significatives plutôt que sur des détails superficiels.

Figure 2
Figure 2.

Une manière plus intelligente de repérer les motifs

Le cœur de la méthode est InSwAV, un réseau construit autour d’un extracteur de caractéristiques personnalisé nommé ResInv. Les réseaux d’images classiques utilisent des filtres de convolution fixes qui glissent sur l’image. ResInv, lui, combine ces filtres avec des opérations d’« involution » qui adaptent leur comportement selon la position, capturant mieux les formes irrégulières et multi‑échelle des bulles d’émail et des fissures. Une fois que ResInv transforme chaque image en une signature compacte, InSwAV ne compare pas les images individuellement. Il les assigne plutôt à un ensemble de « prototypes » appris, ou centres de clusters, puis vérifie si différentes vues augmentées du même fragment tombent dans des clusters compatibles. Une étape mathématique d’équilibrage empêche le modèle de se contenter de tout ranger dans quelques groupes, le forçant à révéler une structure réelle et plus fine.

Précision, vitesse et ce qu’elles révèlent

Sur le jeu de données PRMI, InSwAV distingue correctement les cinq catégories de porcelaine dans 96,2 % des cas, surpassant nettement plusieurs méthodes auto‑supervisées de pointe et même une solide référence supervisée ayant accès aux étiquettes. Il s’entraîne également beaucoup plus rapidement, atteignant une forte précision après seulement quelques heures sur du matériel graphique moderne. Les visualisations de l’activité interne du réseau montrent que ResInv se concentre sur les bulles et les détails microstructuraux clés, tandis qu’une architecture standard a tendance à être distraite par les régions d’arrière‑plan. L’approche est aussi robuste aux différents choix du nombre de clusters, ce qui suggère qu’elle peut bien s’adapter à de nouveaux jeux de données.

Ce que cela signifie pour les pots cassés et au‑delà

En termes simples, l’étude montre qu’un ordinateur peut apprendre à distinguer différentes reliques en porcelaine en étudiant leurs « paysages de bulles » microscopiques, même lorsque les experts fournissent peu d’étiquettes. Cette capacité pourrait aider les musées et les archéologues à trier de grandes collections plus rapidement, à apparier des fragments pour une réassemblage virtuel et à soutenir des études sur la technologie des fours et les réseaux commerciaux. Les auteurs prévoient d’étendre leur jeu de données, de tester la méthode sur des collections d’images plus larges et de simplifier davantage le modèle pour une utilisation sur le terrain. À mesure que ces outils mûrissent, ils promettent de transformer des éclats fragiles, jusqu’ici casse‑tête chronophage, en archives riches et rapidement accessibles du passé.

Citation: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Mots-clés: reliques en porcelaine, imagerie microscopique, apprentissage auto-supervisé, restauration du patrimoine culturel, classification d’images