Clear Sky Science · zh

基于MOEAD的宋代铜镜纹样识别研究

2026-03-16 · 返回目录

古镜为何与现代机器相遇

想象一下，用手机相机就能即时识别出千年铜镜上刻画的神兽。这项研究让这一设想更接近现实。作者将先进的图像识别技术与智能优化策略相结合，自动识别宋代铜镜上的动物纹样，帮助馆员、考古学家及公众更快、更准确地探索文化珍品。

照亮宋代铜镜的光辉

铜镜在古代中国既是日用品，也蕴含深刻的社会与精神意义。到宋代，镜背常饰以复杂场景：龙与凤、鹤与龟、狮与鹿等，各自承载权力、吉祥与信仰的象征。大量此类铜镜被发掘出来，但辨识其细节图案长期依赖专家目力——这一方法既缓慢又带有主观性，难以规模化。作者认为，如果计算机能够可靠地识别这些纹样，将有助于更一致的编目、数字化保存与新的文化分析方式。

把纹样变成计算机可读的数据

为了教会计算机“看懂”这些图案，团队首先建立了包含140件宋代铜镜的专门图像库，覆盖14类动物，从龙凤到鱼、虎与鸳鸯等。每张图像都按纹样精心标注，然后分为训练、验证与测试集。由于数据集规模较小且部分动物稀有，研究人员通过系统化的变换扩充训练样本——裁剪、翻转、旋转、改变颜色与亮度，甚至擦除小块区域。这些变体模拟了文物在不同光照、拍摄角度或磨损情况下的真实外观，帮助模型学习各纹样的核心特征，而非记住少数完好样本。

智能识别系统如何工作

系统核心是名为ResNet50的深度学习模型，一种能从图像中提取视觉模式的“数字之眼”。其设计包含帮助信息在多层中不丢失的“捷径”连接，使其既能捕捉细微表面细节，又能识别更高层次的形状。在此基础上，作者引入了一种来自进化计算的策略MOEA/D。他们不再手工猜测训练参数，而是让一个虚拟候选参数群体在多轮中“进化”。每个候选同时在多项目标上被评估：保持预测误差低、提高各标签的准确率、以及维持稳定性。随着迭代，算法收敛到学习速率与正则化强度的组合，从而在准确性与可靠性之间取得最佳权衡。

对系统的实测

研究者将优化后的模型与三种流行网络进行了比较：VGG16、EfficientNet-B0，以及未经优化的ResNet50。所有模型在相同铜镜图像上训练，并在未见过的样本上测试。优化系统表现突出：在验证集上实现了超过94%的汉明准确率（一种衡量每个标签预测一致性的指标），在测试集上也超过91%，优于其他网络。它在各类别间的表现更平滑，避免了某些动物几乎完全识别而另一些完全识别失败的情况。额外实验，包括统计检验与遮挡研究（隐藏图像部分），表明这些提升并非偶然：模型确实在重复性地关注纹样区域，即使对于一些较稀有的动物也是如此。

对文化遗产的意义

对非专业读者而言，结论很明确：研究表明，经过精心调优的人工智能能可靠地识别数百年历史铜镜上的动物纹样，额外计算成本低且不再完全依赖专家判断。尽管模型在极为稀有或视觉上相似的纹样上仍存在困难，但它已为博物馆与研究人员提供了一个可用于加速编目与支持数字档案的实用工具。随着更大规模图像集的出现以及方法的进一步完善——可能包括更强的数据生成手段与可解释的可视化——类似方法可推广到其他文物领域，从石雕到彩绘织物，使我们物质过去中那些原本隐匿的结构，对学者和公众都变得可见。

引用: Feng, Q., Yu, K., Li, Y. et al. Research on Song dynasty copper mirror pattern recognition based on MOEAD. npj Herit. Sci. 14, 158 (2026). https://doi.org/10.1038/s40494-026-02413-x

关键词: 宋代铜镜, 文化遗产人工智能, 图像纹样识别, 深度学习优化, 文物图案分类