Clear Sky Science · zh
人机协作提高肿瘤试验资格预筛查的准确性和效率:一项使用回顾性电子健康记录的随机评估试验
为何找到合适的患者很重要
对于许多癌症患者来说,参加临床试验可能带来前沿治疗和更好的预后。然而,只有极少数成年癌症患者最终会入组。一个主要瓶颈发生在患者签署知情同意书之前:工作人员必须翻阅冗长且混乱的病历,才能判断谁符合条件。本研究探讨将人类专家与人工智能系统配对,是否能在不拖慢流程的情况下,使早期筛查更准确。
当前试验筛查如何运作
在患者参与癌症试验之前,临床研究人员必须判断患者是否满足数十条详细的入组规则,例如癌种、分期、检测结果以及日常功能状态。大量信息被埋藏在非结构化的笔记中——放射学报告、门诊记录、化验摘要——这些记录常常重复、不完整或互相矛盾。人工逐条查找这些文档既缓慢又让人疲惫,即便是有经验的工作人员也可能漏掉关键细节。因此,一些符合条件的患者可能从未被识别,失去潜在延长生命的机会。
研究者检验了什么
为评估人工智能的帮助作用,研究团队使用了来自社区医疗实践中355名肺癌或结直肠癌患者的电子病历。他们关注12项常见试验标准,包括肿瘤分期、特定生物标志物、既往治疗反应和基本健康状况。一种专门的“神经符号”语言系统先将扫描的病历转为文本,然后识别出检测结果和分期细节等结构化事实。两名受训的研究协调员随后对每份病历进行了两次复审——一次在屏幕上看到AI建议(人+AI方式),一次不见AI建议(仅人工方式),顺序随机。另一组临床医生已为每份病历建立了“金标准”答案,用以评判准确性。

人机团队的表现如何
当人类与AI协作时,他们比仅人工审查更常与金标准答案一致。总体而言,人+AI团队大约能正确识别四分之三的信息,而仅人工审核者略高于七成,且都远优于单独的AI系统。最大收益出现在诸如生物标志物检测与结果、肿瘤的精确分期、以及患者对既往治疗的反应等棘手领域。在这些类别中,AI在海量文本中筛查信息的优势帮助协调员发现他们可能忽略的信息,同时人类纠正了AI的错误并对不确定的情况进行解释。
速度、权衡与人的偏差
令人意外的是,加入AI并没有使流程更快。两种方法平均每份病历都花费略多于半小时。作者认为,AI并非节省时间,而是改变了协调员的工作模式:他们不再亲自寻找每个细节,而是投入更多精力去核查和解释AI建议的条目。这反而可能是一个健康的保障,降低人们照单全收机器答案的风险。研究还探讨了协作可能出错的情形。在一项关于患者功能状态的测量中,AI表现不可靠,那些过于依赖其输出的人工审核者表现略差——这是“自动化偏差”的迹象。在其他方面,人类似乎未充分利用准确的AI信号,暗示存在“确认偏差”,即人们更倾向于接受与其先入印象一致的信息。

这对未来癌症护理意味着什么
简言之,这项试验表明,设计良好的人与AI合作可以在不拖慢速度的情况下,使早期试验筛查略为更准确。改进幅度虽属温和,但集中在那些常决定患者是否能入组的复杂细节上——如生物标志物状态和精确分期。如果此类系统在现场临床工作流程中进一步完善并接受测试,它们可能帮助发现更多符合条件的患者,扩大能获得前沿肿瘤试验机会的人群,同时在人类掌控最终决策的前提下实现这些目标。
引用: Parikh, R.B., Kolla, L., Beothy, E.A. et al. Human-AI teaming to improve accuracy and efficiency of eligibility criteria prescreening for oncology trials: a randomized evaluation trial using retrospective electronic health records. Nat Commun 17, 2306 (2026). https://doi.org/10.1038/s41467-026-68873-8
关键词: 癌症临床试验, 电子健康记录, 人工智能, 患者入组资格, 人机协作