Clear Sky Science · ja
改良型YOLOv11に基づくバティック画像パターン検出の研究
古い布と現代のコードの出会い
中国のミャオ族コミュニティに伝わるバティック布は、単なる装飾以上の存在です。蝶、龍、鳥、花などの紋様は、文字による記録がないなかで歴史、信仰、日常生活を静かに記録しています。しかし、こうした織物が老化し、若い世代が伝統的な手工芸から離れていくにつれて、無数のラベルのない写真や色あせた布の山のなかで重要な文化情報が失われる危険があります。本研究は、高度な画像認識ソフトウェアによって、複雑なバティック画像内の小さく重なり合う紋様を自動で検出・識別できることを示し、この生きた芸術を大規模に保存・解析する新しい手段を提示します。

なぜこれらの模様が重要か
中国のバティックは手作業による染色技法で、特に貴州省のミャオ族の間で二千年以上にわたり発展してきました。ミャオ族は歴史的に文字を持たなかったため、バティックの紋様は神話、儀礼、美意識、社会慣習の視覚的アーカイブとなりました。研究者たちは数学、デザイン、人工知能の手法を用いてこれらの模様をデジタル化・解析し始めています。従来の研究は孤立した紋様の分類は比較的うまく行えましたが、通常はそれらを元の布地から切り出す必要があり、各シンボルと全体構成とのつながりが断たれてしまいました。これにより、衣服や織物上で紋様がどのように相互作用し、重層的な意味を伝えるかを理解するのが難しくなっていました。
単純なラベルから高度な検出へ
著者らは必要なのは分類だけでなく完全な物体検出であり、写真全体で各紋様を位置特定して種類を命名することだと主張します。これは実際のバティック画像では難題です。模様が密集し、サイズが大きく異なり、色あせや亀裂で部分的に隠れていることが多いためです。人気のあるYOLO(You Only Look Once)系アルゴリズムの旧バージョンを含む標準的な検出システムは、こうした条件に苦しみました。非常に小さなシンボルを見落としたり、複雑な背景に惑わされたり、照明や画像品質が不均一な場合に失敗しがちで——まさに館員やフィールド研究者が最も多く収集するような画像群で問題が顕在化します。
布を“読む”ニューラルネットワークの訓練
これらの課題に取り組むため、研究チームはまず現在最大規模となる中国バティック検出データセットを作成しました:861枚の高解像度画像に、7つの紋様カテゴリ(蝶、魚、龍、鳥、太鼓、花、果実)で合計9933のバウンディングボックスを注釈しています。画像のサイズと品質を慎重に均衡させ、限定的なデータを単に暗記させないように、制御されたぼかし、色変更、反転、モザイク、その他の変換を適用してデータ拡張を行いました。このデータセットの上に、著者らは高速性と小型性を重視した最先端の物体検出フレームワークである改良型YOLOv11を構築しました。これらの特性は、本ツールを博物館や文化センターの一般的なコンピュータで動作させる場合に重要です。
遠くを見通し、より鮮明に捉える
改良モデルは二つの主要なアイデアを追加します。まず、VOLOの“vision outlooker”機構に着想を得たコンポーネントにより、ネットワークが小さな局所領域だけでなく画像の離れた部分を同時に参照できるようになります。これにより、離れて配置された二つの小さな形状が同じ意味を持つ模様に属することや、紋様の役割が隣接する要素に依存することを認識しやすくなります。次に、Fused-MBConvと呼ばれる構造を用いて画像特徴の処理方法を再設計しました。この改良により計算効率を維持しつつ、劣化した布地のノイズのなかから微妙なディテールを抽出する能力が高まります。テストと詳細なアブレーション研究において、最終設計は基準となるYOLOv11や他の軽量検出器を上回る平均検出精度を達成しつつ、リアルタイムまたは準リアルタイムでの使用に十分な高速性を保ちました。

自動タグから文化的物語へ
単なる検出スコアにとどまらず、研究者らは各紋様タイプをその起源、象徴的意味、関連事例についての物語に結びつけるバティック知識グラフとモデルを連携させました。プロトタイプのソフトウェアでは、ユーザーが布の写真をアップロードすると検出された紋様がハイライトされ、それをクリックして文化的背景を参照できます。アーカイブ担当者にとっては大規模コレクションのより速く一貫した目録作成を意味し、教育者や来訪者にとっては模様認識がミャオ族の信仰、儀礼、美意識を学ぶ入り口になります。現在のシステムは中国のバティックで訓練されていますが、著者らはこれをインドネシアやインドなどへ広がる異文化間の道具の設計図と見なし、織物のデザインが布自体が老化・色あせても発言し続けられるよう、いつの日か伝統を守る助けになることを期待しています。
引用: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y
キーワード: バティック模様検出, 無形文化遺産, コンピュータビジョン, YOLO物体検出, ミャオ族の織物芸術