Clear Sky Science · ja

高分散で不均衡なダーモスコピー画像における正確な皮膚病変分類:SCTFDフレームワーク

· 一覧に戻る

なぜ賢い皮膚検査が重要なのか

皮膚がんは最も一般的ながんの一つですが、早期に発見されれば治癒しやすい疾患でもあります。皮膚科医は拡大鏡付きの携帯型器具(ダーモスコープ)で撮影したほくろや斑点のクローズアップ写真を参考に、危険な病変を見分けることが増えています。しかし、これらの画像を読み取るのは専門家にとっても難しく、支援するコンピュータも、あるがん種が稀であったり患者ごとに病変の見た目が大きく異なったりすると失敗しやすいのが現状です。本研究は、こうした困難な状況下で皮膚病変の分類をより正確かつ信頼性高く行うことを目的とした新しい人工知能(AI)フレームワーク、SCTFDを提案します。

Figure 1
Figure 1.

稀で扱いにくい皮膚病変の課題

実際の皮膚画像コレクションは均等ではありません。無害であることが多い一般的なほくろは訓練データに何千件も現れる一方、メラノーマや稀な腫瘍など深刻ながんは数百件以下しか含まれないことが多いのです。同時に、同一疾患の病変でも大きさ、色、形が非常に多様に見えることがあります。標準的なAIシステムは多く見られるパターンに過適合し、稀なパターンを見落としがちで、医療の現場ではこれは危険です。単に稀な画像を複製したり合成したり、複雑な生成モデルを用いたりする従来の対策は、リアリズム、安定性、計算コストの面で制約があります。SCTFDは、不均衡と高い変動性を扱いつつ、実用的に使える効率性も保つよう設計されました。

より良い訓練例を作る

SCTFDの第一の構成要素はCN-SMOTEと呼ばれるデータ生成器です。単に画素を補間したり壊れやすい敵対的生成ネットワークを訓練したりする代わりに、CN-SMOTEはエンコーダ—デコーダのペアを用います。一方のネットワークがダーモスコピー画像を圧縮してコンパクトな内部コードに変換し、もう一方がそれを再び画像に復元します。このコンパクトな潜在空間が学習されると、稀クラスの病変間で近傍を見つけ、そのコード同士を補間して混合コードを生成し、デコーダで新しい画像に戻します。同一疾患の病変の内部コードが近くなるように特別な学習ペナルティを設けることで、合成画像が現実的で病変の特徴に忠実になるようにしています。その結果、稀だが重要な病変がより良く表現された、より大きくバランスの取れたダーモスコピー画像集合が得られます。

細部と全体像の両方を見る

第二の構成要素であるMARD-Netは、各画像から豊富な特徴を抽出することに注力します。畳み込み層は境界やテクスチャなどの細かなパターンを拾う可変的な拡大鏡のように働きます。その上で注意(アテンション)モジュールがネットワークに病変が実際に存在する小さな領域に集中することを学ばせ、周囲の健康な皮膚による雑音を低減します。最後に、トランスフォーマーベースの段階が画像全体を俯瞰して病変の遠く離れた部分間の関係、たとえば異なる色や構造の配置を捉えます。トランスフォーマーに通常伴う高い計算負荷を避けるために、著者らはスライディングウィンドウ戦略を導入し、選択された領域でのみ集中的なアテンション計算を行うことで、病変の広い視野を得つつ高速かつメモリ効率よく処理できるようにしています。

Figure 2
Figure 2.

すべてのクラスを公平に扱うようモデルを導く

SCTFDの第三の柱はFDLossと呼ばれる新しい学習目的関数です。FDLossは学習中にAIがどのように自分を調整するかを指示します。すべての画像を等しく扱うのではなく、難しい例や稀な例に重点を置くことで、豊富で簡単な例だけで性能がよく見えるような「お手軽」な学習を防ぎます。これは感度と精度のバランスを評価する規則と、ネットワークが既に正しく分類している自明な例の重みを下げる規則という二つの考えを組み合わせたものです。さらにFDLossは、同一疾患の画像がモデルの内部表現空間で緊密なグループを形成することを促し、異なる疾患同士は遠ざける項を加えます。この組み合わせにより、クラス不均衡と各クラス内の大きな変動という、分類器を混乱させる要因の両方に直接対処します。

新しいアプローチの性能

著者らはSCTFDを、国際的に広く使われている二つの皮膚画像ベンチマーク、ISIC 2018とISIC 2019で評価しました。これらはそれぞれ7種類、8種類の病変にまたがる何万枚もの実臨床ダーモスコピー画像を含み、一般的なほくろに強く偏っています。最先端の複数手法と比較して、SCTFDは精度が高く、真陽性を取りこぼさず誤報を避けるバランスが顕著に改善されました。ISIC 2018で総合精度を約93%、ISIC 2019で約91%に向上させ、ミスと誤分類のバランスを取る指標であるF1スコアでも競合を上回りました。可視化では注意モジュールが病変領域に確実に焦点を当て、訓練後には異なる疾患の特徴がより明確に分離されることが示されました。

患者と医師にとっての意義

患者にとってSCTFDの約束するところは、疑わしい斑点が現れたときにより頼りになるセカンドオピニオンを得られることです。稀ながんの現実的な例を合成し、各画像の最も情報量の多い部分に集中し、疾患タイプ間の明確な分離を強制する損失関数で学習することで、このフレームワークは自動化システムが単に稀であったり非典型的であったりするために危険な病変を見落とすリスクを低減します。皮膚科医の判断に取って代わるものではありませんが、臨床や遠隔医療プラットフォームで早期かつ正確な診断への門戸を下げ、生命を脅かす皮膚がんをより早く、より一貫して発見する助けとなる可能性があります。

引用: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8

キーワード: 皮膚がん検出, ダーモスコピーAI, 医用画像分類, 不均衡データセット, 皮膚科における深層学習