Clear Sky Science · ja

臨床自由記述と皮膚鏡画像を用いた皮膚がん分類のためのマルチモーダルモデル

· 一覧に戻る

なぜより賢い皮膚検査が重要か

皮膚がんは一般的ですが、早期に発見されれば多くの場合経過は良好です。医師は既にほくろの拡大写真を使って、どれが懸念すべきものかを判断しています。本研究は単純だが重要な問いを投げかけます:コンピュータが写真だけでなく各ほくろについての医師の記録も読めるようになれば、皮膚がんをより正確かつ公平に見つけられるのではないか、という点です。

Figure 1. ほくろの写真と医師の記録を組み合わせることで、コンピュータが危険な皮膚病変をより正確に見つけられるようになる仕組み。
Figure 1. ほくろの写真と医師の記録を組み合わせることで、コンピュータが危険な皮膚病変をより正確に見つけられるようになる仕組み。

画像と文章でより完全な情報が得られる

研究者らは英国の一般的な皮膚科診療から大規模なデータセットを構築しました。これには4538人の成人から得られた5481枚の皮膚鏡画像と、年齢や皮膚タイプといった基本的な患者情報、そして4種類の臨床ノートが含まれます。これらのノートは病変の外観や経時変化、家族内の皮膚がんの有無、日光曝露の程度、外科医の所見と計画を扱っていました。各症例には良性か悪性かのラベルが付され、可能な限り生検で悪性が確認されました。

臨床ノートに潜む手がかり

単純なチェックボックス形式とは異なり、自由記述は医師が微妙な特徴を記すことを許します:暗くなってきたほくろ、出血する斑点、長年屋外で働いていた患者など。こうした詳細は非常に有益ですが、同時に答えを露呈してしまうこともあります。多くのノートには著者が「診断を示唆する言葉」と呼ぶ先導的な表現が含まれており、「基底細胞癌、要生検紹介」や「治療不要」といった診断や治療を明示または強く示唆するフレーズがあります。もし機械学習モデルが単にこれらの近道に頼ってしまえば、過去データ上では非常に高い精度を示す一方で、画像や患者が報告する記述から実際にがんを識別する方法を学べない恐れがあります。

近道を無視するようにコンピュータを教える

この問題に対処するため、研究チームは複数段階のテキストクリーニングを設計しました。まず単純な規則で皮膚疾患の明示的な名称や“良性”“悪性”といった語を除去しました。次に大規模言語モデルを用いてより微妙なフィルタリングを行いました。ある設定では、主要な診断フレーズや治療計画を中立的なタグに置き換え、各種の陳述が性能にどれだけ寄与するかを測定できるようにしました。最も厳格な設定では、患者自身が合理的に提供できる事実情報、たとえばほくろがどれくらい前からあるかや過去の紫外線曝露習慣などのみが保持されました。この手法は専門家の内部手がかりに頼るのではなく、患者向けシステムが目にするであろうテキストに近づけることを目的としています。

Figure 2. 混沌とした診療ノートをどのようにフィルタリングしてほくろ画像と統合し、AIモデルがより公平にがんリスクを判断できるようにするか。
Figure 2. 混沌とした診療ノートをどのようにフィルタリングしてほくろ画像と統合し、AIモデルがより公平にがんリスクを判断できるようにするか。

モデルが実際に学んだもの

画像のみを用いたとき、コンピュータモデルは良好に機能しましたが、未処理のノートを追加すると性能は著しく向上しました。主たる精度指標である受信者動作特性曲線下面積(AUROC)は、画像のみで0.909だったのが画像と生ノートの組み合わせで0.970に上昇しました。明白な診断表現をすべて除去しても、画像と慎重にフィルタリングされたテキストを組み合わせることでAUROCは約0.948に達し、どちらか一方のみよりも高い値を示しました。タグ化されたフレーズを用いた実験では、「病院に紹介する」といった単純な行動の記述が明確ながんラベルとほぼ同等の情報を伝えることが分かり、多くのノートに強い内在的バイアスがあることが確認されました。著者らは年齢層や肌色カテゴリ別の性能も検証し、画像のみモデル、完全なマルチモーダルモデルの双方で比較的低い不公平性を見出しました。

将来の皮膚検査にとっての意義

非専門家にとっての重要な結論は、医師のノートにはコンピュータが皮膚がんの判断を支援するのに役立つ実用的な手がかりが含まれているが、それらを扱う際には注意が必要だという点です。モデルが未処理のノートを読み取れるようにすると、危険なほくろ自体を認識することよりも医師の記述を真似することを学んでしまう恐れがあります。本研究は、テキストを慎重にクリーニングし、画像や基本的な患者データと組み合わせることで、隠れたバイアスを抑えつつ精度を高めることが可能であることを示しています。将来的にはこうしたマルチモーダルツールが一次診療医の紹介判断を支援し、専門医への待ち時間を短縮する手助けとなるとともに、いずれは患者向けの安全なテキスト対応システムの基盤を築く可能性があります。

引用: Watson, M., Winterbottom, T., Hudson, T. et al. Multimodal models for skin cancer classification using clinical freetext and dermatoscopic images. Commun Med 6, 277 (2026). https://doi.org/10.1038/s43856-026-01456-2

キーワード: 皮膚がん, 機械学習, 皮膚科, 臨床ノート, 医用画像