Clear Sky Science · de

InSwAV: involutionsverstärkte Merkmalsclusterung und vertauschte Zuordnungen für die Klassifizierung mikroskopischer Bilder von Porzellanerzeugnissen

· Zurück zur Übersicht

Warum zerbrochenes Porzellan für die Gegenwart wichtig ist

In ganz China und darüber hinaus fördern Ausgrabungen Berge zerschlagener Porzellanstücke zutage. Jedes Fragment trägt Hinweise darauf, wie Menschen lebten, handelten und vor Jahrhunderten Hochtemperaturbrände beherrschten. Das Sortieren und Zusammenfügen dieser zahllosen Scherben ist jedoch langsame, fachkundige Arbeit. Diese Studie stellt einen neuen Ansatz der künstlichen Intelligenz vor, genannt InSwAV, der aus mikroskopischen Aufnahmen von Porzellanoberflächen lernt, um Fragmente automatisch nach Typ zu gruppieren. Schnellere und verlässlichere Klassifikation könnte Restaurierungsarbeit deutlich beschleunigen und unser Verständnis des kulturellen Erbes vertiefen.

Figure 1
Figure 1.

Geschichte in winzigen Bläschen sehen

Für das bloße Auge wirken viele Porzellanstücke verwirrend ähnlich: weiße oder blassgrüne Glasuren, abgenutzte Muster und beschädigte Kanten. Unter dem Mikroskop offenbart sich jedoch eine andere Welt. Winzige im Glas eingeschlossene Bläschen zeichnen Details des Tons, der Glasurzusammensetzung, der Brenntemperatur und sogar der Gewohnheiten einzelner Öfen oder Werkstätten auf. Frühere Untersuchungen zeigten, dass Größe, Form und Verteilung dieser Bläschen zwischen Produktionszentren und Epochen variieren und so starke Fingerabdrücke für Identifikation und Datierung liefern. Diese subtilen Muster manuell oder mit traditionellen Bildverarbeitungswerkzeugen zu extrahieren und zu interpretieren ist jedoch arbeitsintensiv und anfällig für Störungen.

Den Computer selbst lehren lassen

Ein großes Hindernis in diesem Bereich ist der Mangel an gelabelten Daten: Spezialisten können nur eine begrenzte Anzahl mikroskopischer Bilder annotieren, und manche Fragmenttypen sind selten. Statt sich auf tausende expertengestützte Beispiele zu stützen, wenden die Autoren selbstüberwachtes Lernen an, bei dem ein neuronales Netzwerk die Struktur der Daten eigenständig entdeckt. Sie bauen den Porcelain Relic Microscopic Image (PRMI)-Datensatz auf, der 7.425 hochvergrößerte Bilder aus fünf Porzellankategorien enthält. Für jede Originalmikroaufnahme erzeugt das System mehrere veränderte Versionen durch Zuschneiden, Spiegeln, leichte Farbänderungen und Unschärfe. Diese „Ansichten“ zeigen dasselbe Material auf verschiedene Weise und zwingen den Rechner, sich auf stabile, aussagekräftige Merkmale statt auf oberflächliche Details zu konzentrieren.

Figure 2
Figure 2.

Eine klügere Methode, Muster zu erkennen

Kern der Methode ist InSwAV, ein Netzwerk, das um einen maßgeschneiderten Merkmalsextraktor namens ResInv aufgebaut ist. Konventionelle Bildnetzwerke verwenden feste Faltungsfilter, die über das Bild gleiten. ResInv kombiniert diese stattdessen mit „Involution“-Operationen, die ihr Verhalten positionsabhängig anpassen und so die unregelmäßigen, mehrskaligen Formen von Glasurbläschen und Rissen besser erfassen. Nachdem ResInv jedes Bild in eine kompakte Signatur verwandelt hat, vergleicht InSwAV nicht einzelne Bilder direkt. Stattdessen weist es sie einer Menge gelernter „Prototypen“ oder Clusterzentren zu und prüft dann, ob verschiedene augmentierte Ansichten desselben Fragments in kompatiblen Clustern landen. Ein mathematischer Ausgleichsschritt verhindert, dass das Modell faul alle Beispiele in nur wenige Gruppen verschiebt, und zwingt es, echte, feinere Strukturen aufzudecken.

Genauigkeit, Geschwindigkeit und was sie offenbaren

Im PRMI-Datensatz unterscheidet InSwAV die fünf Porzellankategorien in 96,2 % der Fälle korrekt und übertrifft damit mehrere führende selbstüberwachte Verfahren sowie eine starke überwachtes Baseline, die Labels verwendete. Es trainiert außerdem deutlich schneller und erreicht hohe Genauigkeit bereits nach wenigen Stunden auf moderner Grafikhardware. Visualisierungen der internen Aktivität des Netzwerks zeigen, dass ResInv sich auf die Bläschen und wichtige mikrostrukturelle Details konzentriert, während eine Standardarchitektur dazu neigt, von Hintergrundbereichen abgelenkt zu werden. Der Ansatz ist zudem robust gegenüber verschiedenen Entscheidungen zur Anzahl der Cluster, was darauf hindeutet, dass er sich gut an neue Datensätze anpassen kann.

Was das für zerbrochene Gefäße und darüber hinaus bedeutet

Einfach ausgedrückt zeigt die Studie, dass ein Computer lernen kann, verschiedene Porzellanerzeugnisse anhand ihrer mikroskopischen „Bläschenlandschaften“ zu unterscheiden, selbst wenn Experten nur wenige Beschriftungen liefern. Diese Fähigkeit könnte Museen und Archäologen helfen, große Sammlungen schneller zu sortieren, Fragmente für virtuelle Zusammensetzungen zusammenzuführen und Studien zur Ofentechnik und zu Handelsnetzwerken zu unterstützen. Die Autoren planen, ihren Datensatz zu erweitern, die Methode an breiteren Bildsammlungen zu testen und das Modell weiter für den Feldeinsatz zu straffen. Wenn solche Werkzeuge reifen, könnten sie zerbrechliche Scherben von zeitaufwändigen Rätseln in reichhaltige, schnell zugängliche Zeugnisse der Vergangenheit verwandeln.

Zitation: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Schlüsselwörter: Porzellanerzeugnisse, mikroskopische Bildgebung, selbstüberwachtes Lernen, Konservierung kulturellen Erbes, Bildklassifizierung