Clear Sky Science · ja

小規模言語モデルとヒト表現型オントロジー（HPO）を用いた日常診療記録からの眼科疾患の自動フェノタイピング

2026-05-09 · 一覧に戻る

眼科医の所見記録をより賢く読むことが重要な理由

眼科受診ごとに、患者の眼に関する観察がぎっしり詰まったレターや報告が作成されます。これらの記録は医療に不可欠ですが、自由記述で書かれ、言語や医師ごとの表現が異なるため、クリニック間で情報を統合したり、大規模な研究用レジストリを作成したり、似た問題を抱える患者を素早く見つけることが難しくなります。本研究は、慎重に設計された人工知能（AI）システムが、こうした雑多な記述を、機密性の高い患者データをクラウドに送らずに、自動できれいな標準化された眼の所見リストに変換できることを示します。

日常の所見を構造化データに変換する

研究者たちは、眼の特徴を含む精密に定義された医療表現の世界的カタログであるヒト表現型オントロジーに着目しました。医師が手作業でこれらのコードを調べて割り当てる（時間がかかり一貫性がない）代わりに、日常の眼科所見のレターを読み取り、一致する標準化用語を出力するAIパイプラインを構築しました。目標は、実際の臨床ノートに含まれる豊富な詳細を捉えつつ、研究、品質管理、多施設レジストリで利用できる形にすることでした。

テキストから眼の所見への段階的な変換

このパイプラインは主に4つの段階で動作します。まず、匿名化したドイツ語の眼科診療ノートを、例示プロンプトで微調整されたコンパクトな言語モデルが英語に翻訳します。次に、長い記述を前眼部や後眼部の単一の特徴を表す短いセグメントに分割します。第三に、正常所見を除外し、疾患が明確に否定されている場合を認識して、真の問題のみを残すようにフィルタリングします。最後に、残った各セグメントを数値ベクトル（埋め込み）に変換し、多言語拡張されたヒト表現型オントロジーの最も近い項目に照合して、特定の標準化された眼の表現型用語を得ます。

眼科用語をシステムに教える

標準カタログには多くの細かな眼疾患やその言い回しが欠けていたため、研究チームはクリニックに合わせたローカルな同義語リストを作成しました。システムがテキストに対して誤った用語を選んだ際には、専門家が訂正してそのフレーズを正しいコードの新しい同義語として追加しました。この「専門家インザループ」プロセスは約1万件の医療報告で繰り返されました。まだグローバルなオントロジーに存在しない新しい眼表現型は国際ヒト表現型オントロジーコンソーシアムに提案され、将来の利用者のために共有標準の改善に寄与しました。

AIが人間の専門家とどれだけ一致したか

性能を評価するために、研究者はランダムに175件の実患者記録を選び、経験ある眼科医に手作業でオントロジー用語を注釈付けしてもらいました。平均して、人間は1通あたり2.53件の関連する眼所見を見つけ、AIは2.52件を出力し、ほぼ同等でした。人間が特定した342件の用語のうち、システムは341件を取得しました。主要な精度指標は良好で、AIと人間の用語集合の重複（ジャカード類似度）は約3分の2、正確性と網羅性のバランス（F1スコア）は約0.80で、他の医療領域の最先端ツールと同等でした。残る誤りの多くは、必要な眼の用語がオントロジーにまだ存在しなかった場合に発生しました。

データを守りながら関連情報を結びつける

このアプローチの注目すべき点は、すべて病院内のローカルハードウェアで実行されることで、厳格なデータ保護規定に準拠しつつ記録の価値を引き出せる点です。自由記述を氏名や直接識別子を含まない標準化コードに変換することで、レジストリや研究のためのより安全なデータ共有を支援します。モジュール式の設計により、他の病院も大規模なAIモデルを再学習させることなく、プロンプトや同義語リストを調整して自院の言い回しや略語に適応できます。

患者と眼科研究にとっての意義

患者にとって、この種の自動フェノタイピングは、希少な病態パターンの早期発見や、治療をより適切に照合・研究することにつながる可能性があります。医師や研究者にとっては、カルテレビューの迅速化、より完全なレジストリ、手作業によるコーディング時間の削減が期待できます。著者らは、信頼できる医療オントロジーを中心に据え、ローカルなクリニックの言語に合わせて調整した検索ベースのAIパイプラインが、日常の眼科所見を正確に構造化された研究対応データに翻訳できることを示し、日常眼科診療におけるAIのより広範な利用への道を開くと結論しています。

引用: Thai, B.D., Arens, S., Reinhard, T. et al. Automated phenotyping of ophthalmologic diseases from routine medical records using small language models and the human phenotype ontology (HPO). Sci Rep 16, 14682 (2026). https://doi.org/10.1038/s41598-026-51512-z

キーワード: 眼科学, 臨床テキストマイニング, フェノタイピング, 医療オントロジー, ヘルスデータの相互運用性