Clear Sky Science · ja

無形文化遺産のための中国語固有表現抽出データセット

· 一覧に戻る

生きた伝統を守るには賢い読み取りが必要な理由

世界各地で、民謡、工芸、地域の祭りなどの生きた伝統は日常生活から薄れつつあります。中国ではこれらの実践を記述した大量の文章が存在しますが、その多くは長いウェブページに埋もれており、人間にもコンピュータにも検索や分析が難しい状態です。本研究は、中国語のテキストから工芸名、名匠、素材、場所といった重要な情報を自動的に抽出できる、精緻に構築されたデータセットと高度な人工知能モデルを紹介します。これらを組み合わせることで、無形文化遺産をデジタル規模で保存・研究するための新しい道具が提供されます。

引用: Long, S., Li, W. A Chinese Named Entity Recognition Dataset for Intangible Cultural Heritage. Sci Data 13, 335 (2026). https://doi.org/10.1038/s41597-026-06700-x

キーワード: 無形文化遺産, 固有表現抽出, 中国語処理, 文化データセット, デジタル保存