Clear Sky Science · zh
基于可解释机器学习并利用XRF化学成分数据对传统韩国陶瓷的分类
陶瓷珍品遇上现代算法
几个世纪以来,专家们凭借目测与经验对韩国最精美的陶瓷——青瓷的温润绿意、粉彩斑驳的文诚瓷、以及素雅宁静的白瓷——进行分类。但当一块瓷片受损、变色或不完全符合教科书上的外观时,会怎样?本研究展示了现代机器学习如何读取这些器物的化学“指纹”以进行客观分类,并解释哪些成分赋予每件器物独特美感。
从釉色到隐含成分
青瓷、文诚瓷与白瓷不仅是博物馆的标签;它们反映了从高丽到朝鲜王朝的审美与工艺演变。青瓷以玉绿色釉面与复杂的嵌饰闻名,文诚瓷以在深色胎体上施以生动的白色泥饰见长,白瓷则以纯净克制的雅致著称。然而,仅凭外观的分类有其局限:早期或试验性作品可能长相各异,风化或断裂也会掩盖关键特征。作者因此转向X射线荧光(XRF),该技术能揭示陶瓷胎体中每种主要氧化物(如二氧化硅、三氧化二铝、氧化铁和二氧化钛)的含量。由于这些化学配方反映了原料与烧成条件,它们提供了一个更稳定的基础来判断一块碎片原先属于何种器类。

教计算机识别古老粘土
研究团队汇编了来自先前科学研究的624份陶瓷样本的XRF数据,均匀覆盖青瓷、文诚瓷与白瓷三类。随后他们仅用十种测量到的氧化物训练了六种不同的机器学习模型以识别这三类。一些模型,如决策树与随机森林,通过简单规则将数据分支;另一些,如支持向量机,则在数学空间中绘出更灵活的边界。为避免模型对该特定数据集过度拟合,作者将部分数据留作测试,并在一组来自独立研究的59个样本上检验了模型的泛化表现。
机器的表现如何
两种基于树的方法——随机森林与极端梯度提升(XGBoost)——表现最好,正确分类了约96%的测试样本。支持向量机仅稍逊一筹,而更简单、规则性更强的方法表现较差。对错误的进一步分析显示出一个耐人寻味的模式:白瓷几乎总是被正确识别,但青瓷与文诚瓷经常相互混淆。这与历史和技术背景相呼应:青瓷与文诚瓷使用相似的粘土且均需高温烧成,早期的文诚瓷常借用青瓷的工艺,因此它们的化学特征自然会有重叠。白瓷则由极为纯净、几乎不含致色物质的瓷土制成,在数据中形成了一个独立的簇群。

解释决策:为何铁与钛至关重要
如果强大的模型像黑盒一样运作,对历史学家帮助有限。为打开黑盒,研究者使用了SHAP方法,为每种化学成分分配一个分数,表明它在多大程度上将样本推向某一陶瓷类别。在表现最佳的模型中,两种氧化物占据主导地位:氧化铁(Fe2O3)和二氧化钛(TiO2)。众所周知,这些成分会在烧成粘土中影响颜色,使色调根据含量和窑内气氛从偏黄到偏蓝绿色变化。机器学习分析证实:低铁与低钛含量强烈指向白瓷;中等含量倾向于青瓷;而较高的铁含量配合中等钛含量则是文诚瓷更暗、更质朴胎体的典型特征。其他氧化物,如含磷和含钠的成分,在当主要致色成分重叠时,起到辅助区分青瓷与文诚瓷的作用。
对解读过去的意义
归根结底,这项研究表明,计算机能够以专家级的准确性对传统韩国陶瓷进行分类,同时清晰地说明哪些成分最为关键。此方法并非要取代策展人和考古学家,而是为他们提供量化的工具:一种校验目测判断、解决边缘案例并更好理解粘土与烧成微小变化如何推动从青瓷到文诚瓷再到白瓷的演变的手段。随着来自不同窑口和时期的更多化学数据被收集,这类可解释的机器学习工具有望成为重建陶瓷技术选择和文化价值时的标准辅助工具,甚至能用于解读最小碎片中蕴含的历史信息。
引用: Cho, Y.E., Sim, S., Choi, J. et al. Explainable machine learning-based classification of traditional Korean ceramics using XRF chemical composition data. npj Herit. Sci. 14, 28 (2026). https://doi.org/10.1038/s40494-026-02301-4
关键词: 韩国陶瓷, 机器学习, XRF分析, 文化遗产, 瓷器分类