Clear Sky Science · zh
InSwAV:用于瓷器文物显微图像分类的逆卷增强特征聚类与交换分配方法
破碎瓷器为何对当代仍重要
在中国乃至更广范围的考古发掘中,常常出土大量破碎的瓷片。每一片碎片都携带着关于古人生活、贸易以及数百年前高温烧制工艺的线索。然而,对这些无数碎片进行分类与拼配是缓慢且需要专家参与的工作。本研究提出了一种新的人工智能方法,称为InSwAV,它从瓷器表面的显微图像中学习,自动将碎片按类型分组。更快且更可靠的分类能够显著加速修复工作,并深化我们对文化遗产的理解。

在微小气泡中发现历史
用肉眼观察,许多瓷片看起来令人困惑地相似:釉色多为白色或淡绿色、图案磨损、边缘破损。但在显微镜下,则呈现出另一个世界。釉层中被困的微小气泡记录了泥料、釉方配方、烧成温度,甚至个别窑口或作坊的习惯。既有研究表明,这些气泡的大小、形状与分布在不同产地和时期之间存在差异,使其成为识别与测年的有力“指纹”。不过,手工或传统图像处理工具提取并解读这些细微模式既费时又易受噪声影响。
让计算机自我学习
该领域的一大障碍是标注数据的匮乏:专家只能为有限数量的显微图像做注释,而且某些碎片类型非常稀少。作者并未依赖成千上万带标签的样本,而是采用自监督学习,让神经网络自行发现数据结构。研究构建了瓷器文物显微图像(PRMI)数据集,包含来自五类瓷器的7425张高倍显微图。对于每张原始微图,系统通过裁剪、翻转、略微调整颜色和模糊等方式生成多个变体。这些“视图”以不同方式呈现相同材料,促使计算机关注稳定且有意义的特征,而非肤浅的细节。

更聪明的模式识别方式
该方法的核心是InSwAV,一个围绕名为ResInv的定制特征提取器构建的网络。标准图像网络使用固定的卷积滤波器在图像上滑动。ResInv则将这些与“逆卷”(involution)操作结合,后者根据位置调整行为,更好地捕捉釉层气泡与裂纹的不规则、多尺度形状。一旦ResInv将每张图像转化为紧凑的特征签名,InSwAV并不直接比较单张图像,而是将它们分配到一组学习到的“原型”或聚类中心,然后检查同一碎片的不同增强视图是否落入相容的簇中。一个数学上的平衡步骤防止模型懒惰地把所有样本都堆到少数几个组里,迫使它发现真实的、较细粒度的结构。
准确性、速度及其所揭示的信息
在PRMI数据集上,InSwAV能以96.2%的准确率正确区分这五类瓷器,明显优于几种主流自监督方法,甚至胜过一个获得标签的强监督基线。它的训练速度也更快,在现代图形硬件上仅需数小时便能达到较高准确度。网络内部活动的可视化表明,ResInv聚焦于气泡及关键微观结构细节,而标准架构则容易被背景区域分散注意力。该方法对簇数的不同选择也表现出鲁棒性,表明它可较好地适应新数据集。
对破碎瓷器及更广领域的意义
简言之,这项研究表明,即使专家提供的标签很少,计算机也能通过研究瓷器的显微“气泡地貌”来区分不同文物。这种能力可帮助博物馆与考古学家更快地整理大型藏品、匹配碎片以进行虚拟重组,并支持对窑炉工艺与贸易网络的研究。作者计划扩展数据集、在更广泛的图像集合上测试该方法,并进一步精简模型以便现场使用。随着此类工具的成熟,它们有望把易碎的碎片从耗时的难题转变为丰富且快速可访问的历史记录。
引用: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0
关键词: 瓷器文物, 显微成像, 自监督学习, 文化遗产修复, 图像分类