Clear Sky Science · ja

腫瘍とリンパ節の包括的セグメンテーションマスクとRECIST測定を備えたCTデータセット

· 一覧に戻る

このがん画像リソースが重要な理由

がん治療の評価には医用画像がますます重要になっています。しかし、医師がCTスキャン上でスライスごとに行う綿密な測定は時間がかかり、専門家ごとに結果が異なることもあります。本稿は、臨床で広く用いられる規則に基づいて腫瘍とリンパ節を丁寧に輪郭付けし測定した、がん患者のCTスキャン新規公開コレクションを紹介します。本データセットは、いつかこの単調な作業の多くを引き受け、世界中でがん治療のモニタリングをより迅速かつ一貫性のあるものにする可能性のあるプログラムを研究者が構築・検証するのを支援するよう設計されています。

医師が現在腫瘍をどう追跡しているか

治療が効果を上げているかを判断するために、放射線科医はしばしばRECIST 1.1という基準に従います。実務では、患者のCTスキャン上で数個の「標的」腫瘍を選び、それぞれの最長可視直径をミリメートルで記録します。時間経過でこれらの直径の合計を以前のスキャンと比較し、病変が縮小、安定、または増大したかを判断します。この方法は臨床試験に秩序をもたらしましたが、欠点もあります:どの腫瘍を選ぶかに大きく依存し、真の3次元サイズではなく一次元測定に頼り、通常は1件の評価に10分以上かかることが多いのです。世界的ながん患者の増加に伴い、これらの制約は放射線科サービスに大きな負担をかけています。

Figure 1
Figure 1.

新しいCTデータセットに含まれるもの

著者らは、チリ大学臨床病院で治療を受けた成人22名の様々ながん(肺、肝、結腸直腸、乳、卵巣、胃、胆嚢、膀胱がんおよびメラノーマを含む)のCTスキャンを収集しました。2017年から2023年に取得された58件の胸部および腹部スキャンシリーズから、測定可能なすべての実質性腫瘍または腫大したリンパ節を同定しました。合計で1,246個の病変を手作業で輪郭付けしました:1,148個の転移(広がった腫瘍)、93個の腫大リンパ節、5個の原発腫瘍です。そのうち82病変については診療記録に記載された公式のRECIST測定値も含めており、日常診療での記録と自動化手法との並列比較が可能になっています。

専門家とAIの協働

このような詳細な輪郭を作成するのは通常非常に時間がかかるため、チームは「ヒューマン・イン・ザ・ループ」戦略を採用しました。経験豊かな放射線科医とレジデントが疑わしい腫瘍の周りに大まかな3次元ボックスを描き、強力なセグメンテーションモデルであるMedSAMが初期の境界を提案しました。レジデントがそれらの境界を修正し、シニアの放射線科医が最終レビューを行いました。各バッチのスキャンが完了するたびに、AIモデルは改良された輪郭で再学習され、次のバッチの支援に使われました。サイクルごとに性能が専門家の受け入れられる水準に近づき、さらなる修正に必要な労力を削減しつつ精度を維持しました。

データが示す腫瘍の特徴

スキャン内のすべての病変が三次元で輪郭化されているため、著者らはサイズや密度を詳しく分析できました。腫瘍の多くは肺と肝臓にありました。肺腫瘍は体積が小さい傾向がありながら相対的に長い直径を持つことが多く、リンパ節は肝腫瘍より体積が大きい一方で主要直径はやや短いという特徴が見られました。チームはまた、CT上でその領域がどの程度明るいか暗いか(組織密度に関連する特性)も調べました。空気に囲まれる肺腫瘍は肝腫瘍やリンパ節と非常に異なる強度パターンを示し、CT画像から得られる単純な数値的特徴で病変タイプの識別に寄与し得ることを示唆しました。重要な点として、病変の最長直径と真の3次元体積との間に強い相関が確認され、RECISTのような直径ベースの規則が慎重に適用されれば全容積測定の実用的な代替となり得ることを支持しました。

Figure 2
Figure 2.

深層学習でデータセットを試す

データセットの活用例を示すため、研究者らは2種類の深層学習システムを訓練・改良しました。まず、MedSAMをファインチューニングして単純なバウンディングボックスから腫瘍を自動セグメントし、専門家の輪郭との重なりスコアは国際的に大規模なデータセットで報告されている範囲と同等の成績を達成しました。次に、広く使われるフレームワークnnUNetを、グローバルな肺および肝画像チャレンジで訓練されたモデルから出発して本チリデータでファインチューニングしました。ファインチューニング後、システムは元の性能に匹敵あるいはそれを上回り、特に肺腫瘍で顕著でした。患者コホートが比較的小さくても、注意深く整備された局所データが特定の病院環境でAIツールの信頼性を大きく高め得ることを示しています。

将来のがん医療にとっての意味

非専門家向けの要点は、このデータセットは診断製品ではなく支援ツールだということです。可視なすべての腫瘍とリンパ節が輪郭化され、多くの場合は正確に測定されたCTスキャンを公開することで、著者らは腫瘍追跡を自動化しようとするアルゴリズムの現実的な学習・検証環境を提供しています。こうしたツールは、放射線科医が手作業の測定に費やす時間を減らし、より複雑な判断に集中できるようにするだけでなく、読影者間のばらつきを減らす助けにもなります。データがラテンアメリカの病院由来で許容度の高いライセンスで公開されていることは、将来の医療AIがより多様な患者で検証されることを促し、自動化されたがんモニタリングが世界中の人々に対して確実に機能する可能性を高めます。

引用: Rojas-Pizarro, R., Vásquez-Venegas, C., Pereira, G. et al. A CT Dataset with RECIST Measurements and Comprehensive Segmentation Masks for Tumors and Lymph Nodes. Sci Data 13, 270 (2026). https://doi.org/10.1038/s41597-026-06597-6

キーワード: がん画像, CTスキャン, 腫瘍セグメンテーション, RECIST, 医療AIデータセット