Clear Sky Science · ja

Swin Transformer と二重注意マルチスケール融合ネットワークを用いた乳がん診断の深層学習フレームワーク

· 一覧に戻る

患者と医師にとってなぜ重要か

乳がんは女性にもっとも多いがんの一つであり、早期発見の主要手段はマンモグラムです。しかしこれらのX線画像の読影は専門家でも難しく、小さな兆候が見落とされることがあります。本研究は、マンモグラムを「広く見る」視点と「細部を拡大する」視点という二つの強力な観察手法を組み合わせることで、放射線科医が乳がんをより確実に検出できるよう支援する新しい人工知能(AI)システムを提案します。

Figure 1
Figure 1.

全体像と細部の両方を見分ける難しさ

現代のAIは医用画像の読影を支援していますが、多くは単一のモデルタイプに依存しています。畳み込みニューラルネットワークは鋭い境界や小さな明るい斑点など局所的なパターンの検出に優れます。一方、ビジョントランスフォーマーは画像全体にわたる関係性の理解に強みがあります。マンモグラムでは、微小な石灰化やわずかな構造の歪みといった小さな変化が重要ですが、それらの意味は乳房全体の構造との関係で判断されます。同時に、実際のマンモグラフィーデータセットは比較的小さく、がん症例が少ない不均衡になりがちで、AIが過学習したりバイアスを持ちやすいという問題もあります。

広く見て深く拡大する二重経路AI

著者らは、グローバルな視点と局所的な視点を明示的に統合するハイブリッドモデル、Swin‑DAMFN を提案します。片方の枝は Swin Transformer を基礎としており、マンモグラムをウィンドウに分割して注意機構により長距離の文脈—乳房内の各領域間の関連性—を捉えます。もう一方の枝は独自の畳み込みネットワークである Dual‑Attention Multi‑scale Fusion Network(DAMFN)です。この枝は微小石灰化やわずかな組織の歪みなど極めて細かな特徴を検出するよう調整されています。内部では複数のスケールや方向で画像を解析する専用ブロックがあり、注意モジュールを用いて臨床的に有益と思われる領域を強調し、背景組織の寄与を抑えます。

より多く、より多様な画像で学習させる

実際のマンモグラフィーデータは限られ、非がんケースに偏ることが多いため、研究者らは学習データを二つの相補的な方法で強化しました。まず、条件付きGANと呼ばれる生成モデルを用いて、特に過小表現されている悪性カテゴリのマンモグラムパッチを現実的に合成しました。これらの生成画像はクラスのバランスを改善し、病変の見え方の多様性をモデルに教えます。次に、実画像および合成画像の両方に対して、明るさ、コントラスト、シャープネスの小さなランダムな調整といった光学的変化(フォトメトリック変換)を適用しました。これにより、AIは照明やノイズといった表層的な要因ではなく、真の解剖学的パターンに注目するようになり、新たなスキャンへの一般化能力が向上します。

Figure 2
Figure 2.

診断時に各要素がどのように連携するか

解析では、前処理したマンモグラムを両方の枝に同時に入力します。Swin Transformer はグローバル構造のコンパクトな概要を生成し、DAMFN は豊富な局所特徴マップを出力します。それらはサイズを合わせて統合され、単一の表現に融合されます。軽量な「トリプレット注意」ブロックがこの融合をさらに洗練させ、チャネルと空間次元を相互に照合して、病変を含む可能性が高い領域へモデルの焦点を導きます。最後に単純な分類ヘッドが情報を平均化して、正常組織、良性所見、あるいは異なる種類の悪性病変といった複数クラスに対する予測を出します。

実務上の意味

チームは Swin‑DAMFN を、広く使われている公開データセットである CBIS‑DDSM と MIAS で評価し、多数の既存の深層学習モデルと比較しました。彼らのシステムは CBIS‑DDSM で約99% の精度、MIAS でもほぼ99% の精度を達成し、がんを見つける感度や誤警報を避ける特異度も同様に高い結果を示しました。綿密なアブレーション研究により、二重枝構造、注意に基づく融合、データ拡張戦略といった各構成要素がこれらの向上に寄与していることが示されました。著者らは、より多様な病院データでのさらなる検証が必要であると注意を促していますが、Swin‑DAMFN のようなハイブリッドAIシステムは乳がんスクリーニングで有力な支援となり得ること、放射線科医が危険な病変をより早期かつ一貫して検出し、負担と不確実性を減らせる可能性があることを示唆しています。

引用: Aldawsari, M.A., Aldosari, S.J., Ismail, A. et al. A deep learning framework for breast cancer diagnosis using Swin Transformer and Dual-Attention Multi-scale Fusion Network. Sci Rep 16, 8941 (2026). https://doi.org/10.1038/s41598-026-37969-y

キーワード: 乳がん, マンモグラフィ, 深層学習, トランスフォーマーモデル, 医用画像AI