Clear Sky Science · zh
一种具可追溯推理的罕见病诊断智能体系统
为何加速找到罕见病至关重要
对罹患罕见病的家庭而言,为病情确诊常常需要多年奔波,经历无数门诊、相互矛盾的意见和无果的尝试。漫长的“诊断漫游”延误治疗、耗尽积蓄,并使患者陷入不确定状态。本研究介绍了 DeepRare,一种旨在作为医生数字化队友的人工智能系统。其目标是更早识别罕见病,并以医师能够核查与信任的方式解释其推理。
面向医生的新型数字助手
DeepRare 的设计贴合真实门诊流程。它可以读取自由文本的门诊记录、结构化的症状清单以及现代基因检测的结果,然后将所有信息汇总为一个按概率排序的罕见病候选列表。与许多仅返回病名的现有工具不同,DeepRare 会生成逐步的推理链,将每个建议与医学文献、专家数据库和相似既往病例关联起来。这样一来,临床医生不但能看到系统的推荐,还能知道推荐的理由。

系统如何推理病历
在系统内部,DeepRare 以“多智能体”架构组织。其核心是一个强大的语言模型,充当协调者,随着新信息到来决定下一步行动。周围分布着专门的辅助模块:有的负责清洗和标准化症状表述,有的检索医学文献和罕见病病例库,还有的解析冗长的基因变异列表。对于每位患者,DeepRare 在收集证据、提出诊断并重新核验自身结论之间循环。如果发现某一候选解释存在问题,它会回溯并寻找更可靠的证据,而不是在不稳妥的猜测上继续推进。
在真实世界中检验 DeepRare
研究人员在来自九个不同来源的 6,401 例患者病例上测试了 DeepRare,数据包含大型公共数据集、在线病例报告以及来自欧洲、北美和中国的四家大型医院。所有这些病例涵盖了涉及 14 个器官系统的 2,919 种不同罕见病,从脑部疾病到肾脏病变。仅使用结构化症状描述时,DeepRare 在约 57% 的病例中将真实疾病排在首位——比次优方法高出 20 个百分点以上,也显著优于广泛使用的工具如 PhenoBrain 和 PubCaseFinder。当同时提供基因测序结果时,DeepRare 的首位命中率升至约 69%,在两个独立医院队列中击败了一款名为 Exomiser 的领先遗传学工具。
将 AI 与人类专家比较
为评估 DeepRare 相较人类专家的表现,研究团队选取一所儿童医院的 163 例疑难病例进行面对面对比。五位在罕见病领域拥有十年以上经验的医师被要求为每例提出最多五个可能诊断,允许使用搜索引擎但不得使用 AI。DeepRare 接收相同的症状信息。结果显示,该系统在允许五次猜测时与临床医生匹配,并且在单一首位预测上实际超越了他们。另有十位罕见病医生审查了系统对 180 例给出的推理链,判定其引用证据中超过 95% 为准确且相关,表明其解释在医学上可靠,而非单纯“AI 编故事”。
可追溯推理为何改变局面
作者指出,除了原始准确率之外,DeepRare 可能重塑罕见病的调查方式。由于系统将推理的每一步与医学来源和相似患者相链接,它能显著减少临床医生在文献检索或病例库搜索上花费的时间。其在多个器官系统上的稳健表现意味着它可以帮助非专科医生识别罕见且不常见的病症,尤其是在没有专门罕见病中心的医院中。研究也提到若干未决挑战,例如相似综合征之间的混淆,以及需要将系统扩展到早期筛查和治疗规划方面。不过,这些发现表明,像 DeepRare 这样经过精心设计的 AI 助手,可能通过在日常临床实践中使罕见病更易识别和推理,从而为数千个家庭缩短诊断漫游。

引用: Zhao, W., Wu, C., Fan, Y. et al. An agentic system for rare disease diagnosis with traceable reasoning. Nature 651, 775–784 (2026). https://doi.org/10.1038/s41586-025-10097-9
关键词: 罕见病诊断, 医疗人工智能, 大型语言模型, 临床决策支持, 基因组医学