Clear Sky Science · ja
基礎モデルを用いた糖尿病性網膜症検出のためのマルチモーダル網膜画像データセット
眼の損傷を早期に見つけることが重要な理由
糖尿病のある人では、眼後部の光を感知する組織(網膜)への損傷が数年にわたって静かに進行し、視力が明らかに低下するころには一部の障害が永続的になっていることがあります。症状が現れる時点では既に回復が難しいことがあるため、定期的な眼底検査で早期に異常を発見することが重要だと医師は知っていますが、何千枚もの画像を手作業で読むのは時間とコストがかかります。本研究は、人工知能(AI)システムが糖尿病性眼疾患をより正確かつ信頼性高く検出できるように設計された、大規模かつ丁寧にラベル付けされた網膜画像コレクションを紹介します。これにより、より早期に多くの患者へ警告を届けることが期待されます。

同じ眼の問題を異なるカメラ視点で見る
眼科医は糖尿病に関連する損傷を確認するために複数の種類のカメラを使います。標準的なカラー眼底写真は、血点、小さな脂肪沈着、新生脆弱血管などが現れる丸く赤みを帯びた領域を示します。超広角画像は網膜のはるか外縁までを含むより広い範囲を捉え、初期の損傷が隠れていることのある遠位部も確認できます。もう一つの手法である光干渉断層計(OCT)は網膜を断面で切り取り、視力を脅かす黄斑浮腫に関連するむくみや液体の貯留を明らかにします。それぞれの方法は同じ病変過程の異なる部分を示し、併せて網膜の健康状態をより完全に把握できます。
この画像コレクションの新しい点
既存の公開データセットは糖尿病性眼スクリーニング向けの多くのAIシステムを促進してきましたが、ほとんどは単一の撮影法に注力し、全体の疾患グレードのような粗いラベルしか提供していません。中にはラベルのノイズが多いものや重要な病変タイプを欠くもの、広角画像のカバーが不十分なもの、黄斑浮腫に関する詳細情報が欠けるものもあります。新しいMMRDRデータセットはこれらのギャップを埋めることを目的としています。本データセットは標準的なカラー写真、超広角画像、OCTスキャンの3つのモダリティにまたがる24,460枚の画像を収集し、豊富な専門家注釈を付与しています。カラーおよび広角画像については、医師が全体の病変を5段階で評価し、血管の小さな膨らみ、出血、網膜剥離など7種類の特定病変を記録しました。OCTスキャンでは、黄斑浮腫が存在しないか、中心外に存在するか、視力中心に直接影響しているかを記述しています。
画像の精選とラベリングの方法
著者らは標準的なカラー写真を既存の公開コンペティションデータセットから抽出し、広角およびOCT画像は中国の大規模な眼科病院から糖尿病患者を中心に取得しました。ブレや不適切な照明、中心領域の欠損などの低品質画像を除去し、残るスキャンが臨床的に有用であることを保証しました。4名の経験豊富な眼科医と1名の上級網膜専門医が国際ガイドラインに基づく明確な評価ルールを作成しました。専門医はまず参照用の画像セットを作成し、他の評価者はこのセットで練習して専門家の判断と高い一致を得られるまで訓練しました。その後、評価者らは数千枚の画像を独立してラベル付けし、不確かなケースは専門医に差し戻しました。最終コレクションは、徹底したラベリングと医師間の高い一致を両立させており、AIの学習用として信頼できる教材となっています。
今日のAIを明日の眼科データで試す
研究チームは次にこのデータセットを用いていくつかの先進的AIモデルを評価しました。一般的な画像とテキストで事前学習された大規模な視覚言語モデル、日常写真で訓練された標準的な画像分類器、眼画像に既に調整された新しい「基礎」モデルなどをテストしました。総じて、モデルは超広角画像で最も苦戦しました。より広い視野と複雑なパターンにより、標準的なカラー写真と比べて精度が低下したためです。眼画像専用に設計されたモデルは、一般的なマルチモーダルシステムよりも標準視野から広角視野への転移がうまくいき、網膜構造に関する知識が重要であることを示唆しました。研究者らがMMRDRで1つの大規模マルチモーダルモデルをファインチューニングしたところ、性能は著しく向上し、このデータセットが非常に柔軟なAIシステムにも眼疾患の扱い方を教えられることを示しました。

将来の眼科診療にとっての意味合い
端的に言えば、本研究は糖尿病性網膜障害を見つける学習を行うコンピュータにとって高品質な教材ライブラリを提供します。3つの相補的な撮影法と詳細な専門家ラベルを組み合わせることで、MMRDRデータセットは疾患の重症度を評価し、個々の病変を特定し、黄斑浮腫を追跡するAIツールを構築・公平に比較することを可能にします。これらの画像自体が失明を治すわけではありませんが、より信頼できる自動化スクリーニングシステムの基盤を提供し、視力を脅かす変化をより早期に発見し、糖尿病患者の多くに専門的な眼科医療を届きやすくする助けとなるでしょう。
引用: Tang, Z., Wang, L., Guo, Z. et al. A multimodal retinal image dataset for diabetic retinopathy detection using foundation models. Sci Data 13, 639 (2026). https://doi.org/10.1038/s41597-026-07005-9
キーワード: 糖尿病性網膜症, 網膜イメージング, 医療用AI, 基礎モデル, 眼科OCT