Clear Sky Science · zh
在多种工作流程设置中前瞻性评估人工智能融入乳腺癌筛查:GEMINI 研究
这对女性和诊所为何重要
乳腺筛查能挽救生命,但也对专科医生提出了沉重要求,并且在女性被不必要召回时可能引起焦虑。本研究在苏格兰一项真实的国家卫生服务(NHS)乳腺筛查项目中进行,提出了一个务实的问题:人工智能(AI)是否能帮助医生找到更多癌症,同时保持召回率和工作量在可控范围内?研究者没有只测试单一设置,而是探索了多种将 AI 融入日常筛查的方式,为面临不同压力和优先事项的诊所提供了路线图。

目前乳腺筛查的运作方式
在英国,年龄在50到71岁的女性每三年会被邀请做一次乳腺X线摄影(钼靶)。每组影像由两位受过训练的人类阅片者独立判读。如若存在分歧,由第三位专家做出最终决定。这种“双重阅片”方法提高了安全性,但需要大量专科时间。同时,医疗系统面临前来筛查的女性人数上升和放射科医生短缺。因此,任何新工具不仅要能够识别癌症,还必须适应现有系统并帮助管理有限的人力时间。
GEMINI 研究旨在检验的内容
GEMINI 研究随访了2023年在英国某地区参加常规筛查的10,889名女性。所有人都接受了标准护理:她们的乳腺影像由两位人类专家判读,如需仲裁则进行仲裁。与此同时,一款名为 Mia 的商业 AI 系统也对影像进行了分析并静默记录了其意见。研究团队随后采用了两种主要思路。首先,他们将 AI 作为“额外安全网”:如果 AI 建议召回但筛查团队没有,该影像会被送去额外的人类复核。其次,他们使用已存储的 AI 输出模拟不同的“分诊”设置,在这些设置中 AI 有时可替代第二位阅片者以节省时间。总共模拟了17种混合这些方法的不同工作流程。
当 AI 充当额外阅片者时发生了什么
当 AI 与常规不召回决定存在分歧时,资深阅片者会对这些乳腺影像再次审阅。在1,345例此类情况中,有55名女性被召回进行进一步检查,并发现了11例在该次就诊中否则会被漏掉的额外乳腺癌。这些大多数为侵袭性癌症,且许多体积相对较小。重要的是,复核这些额外病例的速度很快:大约九成在一分钟内读完,速度与典型的乳腺影像判读相当或更快。这表明有经验的阅片者能够高效利用 AI 提示,在与既往影像对比时既确认真正的可疑病变,又自信地排除无害改变。

AI 分诊如何减轻负担
团队随后探讨了 AI 如何安全地替代部分第二位人类判读。在“分诊”工作流程中,当第一位人类阅片者与 AI 意见一致时,该结果维持,且这些病例无需第二位阅片者。在“分诊阴性”工作流程中,此捷径仅在双方一致认为无需召回时使用,这样既避免了额外召回又节省了工作量。根据为 AI 设定的判定阈值,这些模拟策略可将总体阅片工作量减少约三分之一到近一半。部分版本略微降低了检出癌症的数量,而另一些则在保持癌症检出率的同时甚至降低了被召回进行后续检查的女性比例。
为每个诊所找到最佳平衡点
作者偏好的主要工作流程将“分诊阴性”设置与 AI 的额外阅片角色结合。在该配置下,常规筛查发现的所有癌症仍被检测到,外加 AI 提示的11例额外癌症。此举将癌症检出率提高了约10%——大约每1,000名筛查女性中多发现一例癌症——同时将召回率基本保持不变,并将人工阅片工作量最多削减31%。其他测试的工作流程提供了不同的权衡,例如更大的工作量节省和更少的误报,但代价是错过一些主流程本可以检测到的小量癌症。
这对未来乳腺筛查意味着什么
对非专科人士来说,关键结论是 AI 并不会替代乳腺筛查中的医生,但可以作为灵活的助手。在这项真实世界评估中,经谨慎使用的一种 AI 系统在不增加被召回女性数量的情况下帮助发现了更多癌症,并释放了相当一部分专家阅片时间。由于研究探索了多种可能的设置,卫生服务机构可以选择最符合其需求的配置,无论是最大化癌症检出、最小化不必要召回,还是缓解人员短缺。还需要在其他地区、使用不同 AI 工具并进行更长期随访的进一步工作,但本研究表明,经过深思熟虑的 AI 融入可使乳腺筛查更精准且更可持续。
引用: de Vries, C.F., Lip, G., Staff, R.T. et al. Prospective evaluation of artificial intelligence integration into breast cancer screening in multiple workflow settings: the GEMINI study. Nat Cancer 7, 484–493 (2026). https://doi.org/10.1038/s43018-026-01126-1
关键词: 乳腺癌筛查, 人工智能, 乳腺摄影, 放射学工作量, 癌症检测