Clear Sky Science · ja
PETWB-REP:対応する放射線科レポートを備えた多癌種全身FDG PET/CTデータセット
この新しいがん画像資源が重要な理由
腫瘍の全身での振る舞いを把握するために、がん専門医は高度なスキャンとコンピュータツールにますます依存しています。しかし、強力な人工知能システムが学習するには、実際の患者スキャンを大量かつ慎重に整理したコレクションが必要で、そうしたデータは意外に稀で安全に共有するのが難しいことが多いです。本稿はPETWB-REPを紹介します。これは全身のがんスキャンと対応する医師の報告を公開した新しいコレクションで、より良い診断ツールの開発と世界的な研究の加速を目指しています。

全身を見渡す窓
PETWB-REPプロジェクトはFDG PET/CTというタイプのスキャンを中心にしています。これは同時に体の二つの側面をとらえる検査です。CTは骨や臓器のような詳細な解剖学的構造を示し、PETは糖を多く消費している部分を明瞭にし、そこはしばしば活動性のあるがんを示します。これらの画像を融合することで、腫瘍の位置だけでなく、その活動性も把握できます。本データセットは肺、肝、乳房、前立腺、卵巣など多様ながんを含む490人分の全身スキャンを収集しており、単一腫瘍種に焦点を当てた従来のコレクションよりも幅広い構成になっています。
診療現場から研究利用可能なデータへ
すべてのスキャンは2021年から2024年にかけて上海の大規模画像センターで日常診療の一部として収集され、倫理委員会の監督の下で行われました。患者はスキャン前に絶食し、放射性の糖(トレーサー)を慎重に測定して注射され、その後トレーサーが体内に広がるのを待つために休息しました。各スキャンは標準化されたプロトコルに従い、頭蓋底から大腿中部までをカバーしており、患者間で画像を比較できるようになっています。画像に加えて年齢、性別、がんの種類、スキャン実施の詳細といった基本情報も記録され、医用画像共有向けの一貫した構造で保存されています。
詳細を保ちながらプライバシーを守る
臨床スキャンを安全な公開資源に変換するには、個人情報を除去しつつ医療上有用な詳細は保持する慎重な手順が必要でした。研究者らはまず画像ファイルから氏名、IDその他の識別子を削除し、研究コードに置き換えました。次に専門のツールを用いてCT画像から顔の特徴をデジタル処理で除去し、患者が認識されないようにすると同時に頸部や体幹の解剖学的情報は解析に利用できるように維持しました。さらに二名の研究者がスキャンとテキストを手作業で確認し、識別可能な情報が残っていないことを確かめました。その結果、腫瘍のパターンや臓器構造は保持しつつ、患者個人が特定されない画像とレポートのセットが得られています。
画像と言葉をつなぐ
PETWB-REPの特徴の一つは、各スキャンに経験豊富な核医学医師が作成した詳細な放射線科レポートが付属している点です。これらのレポートは体の各領域で医師が観察した所見を記し、疑わしい病変の大きさや挙動に触れ、総合所見で結びます。国際的な利用を可能にするため、元の中国語レポートは機械翻訳で英語に翻訳され、その後バイリンガルの専門家が慎重に校正して、両言語を並べて公開しています。画像と記述が豊かに対応付けられているため、画像のパターンと医師の記述・解釈を結びつけるシステムの学習に最適なデータセットです。

研究者がこの資源を活用する方法
最終データセットは「生」スキャンと、コンピュータ処理しやすくした版に整理されています。チームはデータを広く使われている研究フォーマットに変換し、画像の明るさとコントラストを調整し、PETとCTビューの位置合わせを行い、各症例を要約するマスターテーブルを作成しました。また、すべての患者にスキャンとレポートの整合性があり、画像に重大な欠陥がないことを確認する品質チェックも実施しました。この基盤により、研究者は腫瘍を自動で検出・輪郭化するツールの構築や、画像とテキスト情報を組み合わせた予後予測、あるいはスキャンからのレポート下書き生成などを行えます。データは単一施設由来であり、がんの混合比率は地域の臨床実践を反映していますが、PETWB-REPの規模、多様性、丁寧な準備により、医療研究および人工知能研究の有力な出発点となります。
引用: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w
キーワード: PET/CT画像, 多癌種データセット, 放射線科レポート, 医療AI, マルチモーダル画像