Clear Sky Science · zh

基于保真度驱动的数据扩增用于建筑遗产解读的多模态大型语言模型

· 返回目录

为什么老建筑需要智能的数字助手

在许多历史城市中,精美的街廊和风化的建筑立面正在消失或被彻底重建。专家们争相记录和保护这些建筑遗产,但工作进展缓慢,并且需要对风格、结构和历史有深入了解。本研究探讨了一种新型人工智能——能够看图并读文本的多模态大型语言模型——可能如何提供帮助,以及它们需要何种精心制作的训练数据,才能真正理解老建筑,而不是对其进行简单的猜测。

引用: Huang, R., Lin, HC. & Zeng, W. Fidelity-driven data augmentation for multimodal large language model on architectural heritage interpretation. npj Herit. Sci. 14, 179 (2026). https://doi.org/10.1038/s40494-026-02446-2

关键词: 建筑遗产, 多模态人工智能, 数据扩增, 历史立面, 文化保护