Clear Sky Science · zh

用于非物质文化遗产的中文命名实体识别数据集

· 返回目录

为何保护活态传统需要智能阅读

在世界各地,民间音乐、手工艺和地方节庆等活态传统正面临从日常生活中淡出的风险。在中国,大量文字资料已经记载了这些实践,但大多分散在长篇网页中,既不易被人检索,也难以被计算机分析。本研究引入了一个精心构建的中文数据集和一个先进的人工智能模型,能够自动识别这些文本中的关键信息,例如工艺名称、传承人、材料和地点。二者结合,为以数字化规模保存和研究非物质文化遗产提供了新工具。

引用: Long, S., Li, W. A Chinese Named Entity Recognition Dataset for Intangible Cultural Heritage. Sci Data 13, 335 (2026). https://doi.org/10.1038/s41597-026-06700-x

关键词: 非物质文化遗产, 命名实体识别, 中文语言处理, 文化数据集, 数字化保护