Clear Sky Science · zh

通过多模态特征提升对20世纪韩国绘画的无监督聚类

· 返回目录

洞察韩国现代艺术的模式

如果一台计算机仅通过观察画作就能帮助我们理解画家之间的相似性或截然不同之处,会怎样?本研究利用人工智能审视20世纪的韩国绘画,揭示色彩、质地和风格中的潜在模式。对于博物馆参观者、艺术爱好者和好奇的读者而言,它提供了一种新的视角,去看出艺术家的独特性,以及他们的作品如何悄然聚成一些风格“家族”,这些分群有时甚至连专家也会争论。

构建精心挑选的艺术语料库

为了让计算机从有意义的数据中学习,研究人员首先汇集了一个聚焦的数字收藏:11位重要的现代与当代韩国艺术家的1,100幅画作,涵盖水墨山水、抽象画与写实主义等流派。每位艺术家贡献了100件作品,主要来自国立现代美术馆(MMCA)及其他可信机构和基金会。该群体包括抽象先锋、描绘日常生活的现实主义画家、水墨革新者,以及将民间传统与现代表达相融合的艺术家。他们在重要国家展览中的突出地位(包括著名的李健熙收藏)有助于确保数据集反映的是20世纪韩国艺术的核心,而非零散的图像集合。

将绘画翻译为数字

计算机无法像人一样“看”艺术,因此团队把每幅画转换成一组数值特征。他们用两种不同方式捕捉基本的色彩信息(RGB和HSV),采用灰度共生矩阵等方法测量细粒度的纹理模式,并引入了来自预训练视觉-语言模型CLIP的强大语义快照。CLIP最初在海量的图像-文本对上训练,因此携带对影像外观的广泛、具有语言意识的理解。对于每幅画,这四类信息——颜色、色彩变化、纹理和语义印象——经归一化后合并为一个平衡的特征向量,形成对作品视觉特征的紧凑而丰富的指纹。

Figure 1
Figure 1.

让聚类自行浮现

研究人员没有在训练时告诉计算机哪幅画属于哪位艺术家,而采用了无监督的方法:让算法自行将相似的画作归在一起。首先,使用t-SNE将高维指纹降到二维以便可视化整体结构。然后用K-means聚类把画作分成许多小组,之后进一步精炼以聚焦最有意义的簇。仅在这个过程完成后,团队才在每个组内通过多数投票附加艺术家姓名,以检验簇与真实作者之间的吻合程度。方法的最佳版本——等权融合CLIP、颜色与纹理——大约82%的时间准确地将画作匹配到其作者,优于仅依赖单一线索(如仅颜色或仅纹理)的版本。

计算机在色彩与笔触中所见

聚类结果不仅是数字;它们呈现出可识别的视觉叙事。当团队绘出簇图,大多数艺术家形成了紧密且分离良好的点群岛屿,每个岛屿内充满具有代表性的作品,共享明显特征:以精细笔触表现的单色水墨山水、以原色呈现的大胆几何抽象,或构图稳重且纹理重复的静物。在那些作品风格依赖标志性色调的艺术家中——例如亮色色块或特定的调性和声——简单的色彩线索已能很好地工作。对另一些人,如水墨画家或以戏剧性笔触见长的表现主义者,纹理和语义信息则至关重要。误分类常发生于人类专家也会犹豫的情况:构图相似的抽象画家,或共享流畅线条与重叠色彩选择的艺术家。在这些情况下,错误反而成为揭示不同署名间真实视觉亲缘关系的线索。

Figure 2
Figure 2.

从数据到更深的艺术理解

对于非专业人士而言,关键结论是:计算机仅凭数字图像就能恢复许多艺术史学家已知的关于作品归属的信息——甚至揭示意想不到的关联。通过结合颜色、纹理与学习到的语义印象,该框架提供了一种可重复且相对客观的方式,用于对现代和当代韩国画家的作品进行分组和比较。它并不取代人类判断或专家所带来的丰富文化语境,但提供了一张定量的地图,引导观察者关注值得深入查看的簇群、边界地带和视觉上的亲属关系。由此,机器学习成为策展人与观众的新伙伴,帮助他们在庞大馆藏中导航,发现韩国现代艺术众多声音如何交织成一个复杂但可分析的视觉图景。

引用: Baek, S., Park, SJ., Park, SE. et al. Toward enhanced unsupervised clustering of 20th century Korean paintings via multimodal features. npj Herit. Sci. 14, 76 (2026). https://doi.org/10.1038/s40494-026-02304-1

关键词: 韩国现代艺术, 人工智能, 绘画风格分析, 图像聚类, 数字艺术史