Clear Sky Science · ja
乳がん検出における市販のデジタル乳房トモシンセシスモデルのサブグループ性能
女性と家族にとってなぜ重要か
乳がん検診は命を救いますが、どんな検査も完璧ではありません。医師は現在、複雑な3D乳房X線画像の読影を支援するために人工知能(AI)に頼り始めています。本研究は広く使われているAIシステムが、異なる女性の集団やさまざまな種類の乳房変化に対してどのように機能するかを詳しく調べ、ツールがよく働く領域と苦手とする領域を明らかにしました。 
新しいタイプのマンモグラムを詳しく見る
従来のマンモグラムは平面の二次元X線検査です。多くのクリニックでは現在、乳房の薄いスライスを多数組み合わせて作る3Dに近いスキャンであるデジタル乳房トモシンセシスを使用しています。重なり合う組織に隠れたがん、特に濃密な乳房では見つかりにくいがんを発見できる反面、画像の読影には時間がかかり、早期の病変を示す微小な石灰化を見逃すこともあります。こうした理由から、企業は放射線科医が注視すべき領域を示すAIツールを開発してきました。これまでの評価の多くは全体精度に焦点を当てており、特定の患者群や腫瘍タイプに対する振る舞いまでは十分に検討されていませんでした。
大規模な現場データによるAIの実地検証
エモリー大学の研究者らは、INSIGHT DBTと呼ばれる市販のAIシステムを、61,000人以上の女性の167,000件を超えるスクリーニング検査の3D乳房画像で検証しました。研究者らはAIのスコアを実際の転帰と比較し、明確に陰性の検査、良性の生検、確証されたがんを分類しました。主要な問いは、ルーチンのスクリーニングで見つかったがんと、がんでないと判定された検査をAIがどれだけ正確に区別できるかでした。全体ではAIは高い性能を示し、がん性と非がん性の検査を大部分で正しくランク付けし、当初の規制審査時の結果と一致しました。年齢、人種、民族別でも性能は概ね同等であり、ケアの公平性という観点で重要な発見です。
AIが得意な領域と苦手な領域
詳細を掘り下げると、重要な傾向が浮かび上がりました。AIは固い塊を形成する浸潤がんや、乳房組織に目に見える歪みを生じるケースの検出に最も優れており、これらの多くを正しく検出しました。一方、乳管内にとどまる非浸潤性病変(in situ)や、主に微細な石灰化として現れるがんには信頼性が低く、これらの早期病変のおよそ半数近くを見逃し、全体の精度が低下しました。濃密乳房組織も性能をやや低下させる傾向があり、濃密組織が微妙な兆候を隠すことがその一因と考えられます。 
スコア分布が示すこと
単なる二値判定ではなくAIスコアの全範囲を調べると、より病理学的に憂慮される所見は高いスコアを受け取りやすいことが示されました。良性や低リスクの所見は通常低いスコアであり、浸潤がんは高い方に集まっていました。しかし、非がん性の歪みが高いスコアを受けて誤アラームを引き起こすことや、まれな浸潤がん亜型や非浸潤病変が過小評価されることも見られました。さらに、定期検診と検診の間に発見されたがんの約3分の1にAIが高スコアを付けており、AIが人間の読影者よりも早くヒントを捉える場合があることを示唆していますが、その臨床的影響は現場ではまだ不確かです。
患者と臨床医への示唆
一般読者への要点は、このAIツールが複雑な3D乳房画像の読影において放射線科医を有意に支援できる一方で、主要な人口集団間で明らかな性能差は見られなかったということです。しかし、これは単独で乳がんを検出する装置ではありません。最も初期の石灰化を伴うがんや非常に濃密な乳房では信頼性が低く、いくつかの良性ケースで不必要な追加検査を引き起こす可能性があります。著者らは、日常のスクリーニングでAIに依存する前に、こうした強みと盲点を理解し、医師がAIを置き換えではなく慎重なパートナーとして利用できるようにすることが不可欠だと論じています。
引用: Brown-Mulry, B., Isaac, R.S., Lee, S.H. et al. Subgroup performance of a commercial digital breast tomosynthesis model for breast cancer detection. Nat Commun 17, 4249 (2026). https://doi.org/10.1038/s41467-026-70637-3
キーワード: 乳がんスクリーニング, デジタル乳房トモシンセシス, 医療用AI, マンモグラフィー, 非浸潤性乳管内癌(DCIS)