Clear Sky Science · zh

人机协作提高肿瘤试验资格预筛查的准确性和效率：一项使用回顾性电子健康记录的随机评估试验

2026-02-03 · 返回目录

为何找到合适的患者很重要

对于许多癌症患者来说，参加临床试验可能带来前沿治疗和更好的预后。然而，只有极少数成年癌症患者最终会入组。一个主要瓶颈发生在患者签署知情同意书之前：工作人员必须翻阅冗长且混乱的病历，才能判断谁符合条件。本研究探讨将人类专家与人工智能系统配对，是否能在不拖慢流程的情况下，使早期筛查更准确。

当前试验筛查如何运作

在患者参与癌症试验之前，临床研究人员必须判断患者是否满足数十条详细的入组规则，例如癌种、分期、检测结果以及日常功能状态。大量信息被埋藏在非结构化的笔记中——放射学报告、门诊记录、化验摘要——这些记录常常重复、不完整或互相矛盾。人工逐条查找这些文档既缓慢又让人疲惫，即便是有经验的工作人员也可能漏掉关键细节。因此，一些符合条件的患者可能从未被识别，失去潜在延长生命的机会。

研究者检验了什么

为评估人工智能的帮助作用，研究团队使用了来自社区医疗实践中355名肺癌或结直肠癌患者的电子病历。他们关注12项常见试验标准，包括肿瘤分期、特定生物标志物、既往治疗反应和基本健康状况。一种专门的“神经符号”语言系统先将扫描的病历转为文本，然后识别出检测结果和分期细节等结构化事实。两名受训的研究协调员随后对每份病历进行了两次复审——一次在屏幕上看到AI建议（人+AI方式），一次不见AI建议（仅人工方式），顺序随机。另一组临床医生已为每份病历建立了“金标准”答案，用以评判准确性。

人机团队的表现如何

当人类与AI协作时，他们比仅人工审查更常与金标准答案一致。总体而言，人+AI团队大约能正确识别四分之三的信息，而仅人工审核者略高于七成，且都远优于单独的AI系统。最大收益出现在诸如生物标志物检测与结果、肿瘤的精确分期、以及患者对既往治疗的反应等棘手领域。在这些类别中，AI在海量文本中筛查信息的优势帮助协调员发现他们可能忽略的信息，同时人类纠正了AI的错误并对不确定的情况进行解释。

速度、权衡与人的偏差

令人意外的是，加入AI并没有使流程更快。两种方法平均每份病历都花费略多于半小时。作者认为，AI并非节省时间，而是改变了协调员的工作模式：他们不再亲自寻找每个细节，而是投入更多精力去核查和解释AI建议的条目。这反而可能是一个健康的保障，降低人们照单全收机器答案的风险。研究还探讨了协作可能出错的情形。在一项关于患者功能状态的测量中，AI表现不可靠，那些过于依赖其输出的人工审核者表现略差——这是“自动化偏差”的迹象。在其他方面，人类似乎未充分利用准确的AI信号，暗示存在“确认偏差”，即人们更倾向于接受与其先入印象一致的信息。

这对未来癌症护理意味着什么

简言之，这项试验表明，设计良好的人与AI合作可以在不拖慢速度的情况下，使早期试验筛查略为更准确。改进幅度虽属温和，但集中在那些常决定患者是否能入组的复杂细节上——如生物标志物状态和精确分期。如果此类系统在现场临床工作流程中进一步完善并接受测试，它们可能帮助发现更多符合条件的患者，扩大能获得前沿肿瘤试验机会的人群，同时在人类掌控最终决策的前提下实现这些目标。

引用: Parikh, R.B., Kolla, L., Beothy, E.A. et al. Human-AI teaming to improve accuracy and efficiency of eligibility criteria prescreening for oncology trials: a randomized evaluation trial using retrospective electronic health records. Nat Commun 17, 2306 (2026). https://doi.org/10.1038/s41467-026-68873-8

关键词: 癌症临床试验, 电子健康记录, 人工智能, 患者入组资格, 人机协作