Clear Sky Science · zh

从“阴性”试验到积极的临床影响:减轻模拟临床试验中由入组标准引起的时间选择偏倚

· 返回目录

为什么谁入组很重要

当我们听说一项临床试验发现两种治疗没有差异时,很容易认为故事到此结束。但当医生后来试图用日常护理中的真实病历去重演那项试验,会发生什么呢?本研究表明,有关谁可以进入“复制”试验的规则可以悄悄地扭曲结果,有时这种影响比时间流逝或医学实践的变化更加显著。

Figure 1. 大型健康记录研究如何重演一项心脏药物试验,以及患者选择如何改变总体结果。
Figure 1. 大型健康记录研究如何重演一项心脏药物试验,以及患者选择如何改变总体结果。

从受控试验到真实世界

原始的 WARCEF 试验比较了两种抗凝药物——华法林和阿司匹林——用于心力衰竭且心脏收缩功能减弱但无常见心律失常(房颤)患者。在这项精心设计的实验中,2300 多名志愿者被随机分配到其中一种药物,试验发现两者在预防死亡方面没有明显优劣。随后,指南建议除非有强烈理由,否则不要常规让类似的心衰患者长期服用华法林,部分原因是其降低中风风险的好处被更严重的出血风险所抵消。

用健康记录重演 WARCEF

新研究考察了如果研究者试图使用梅奥诊所的电子健康记录来“模拟”WARCEF 会怎样。研究者不是随机分配药物,而是考察了数千名在常规医疗中恰好被处方阿司匹林或华法林的患者,这些患者覆盖了2014 年 WARCEF 完成前后。他们使用统计方法平衡两组之间明显的差异,并采用意向治疗分析,将患者按起始用药计入,即便之后用药改变也如此,以模仿原始试验的逻辑。

2014 年后的意外变化

乍看之下,结果显示随时间发生了显著变化。在 2014 年之前接受治疗的患者中,两种药物的死亡率无显著差异,呼应了原始试验。但在 2014 年之后接受治疗的患者中,华法林与更高的死亡风险相关,而阿司匹林看起来更安全。当研究者合并所有年份的数据时,后期患者主导了总体结果,使阿司匹林的安全性显著占优。此模式可能暗示,一旦医生看到试验结果和新指南,临床上华法林的使用方式发生了变化,其表观效果变差。

一个入组规则如何扭曲全局图景

更仔细的观察揭示了不同的故事。为了忠实于试验,研究团队尝试应用许多相同的入组规则,包括称为改良 Rankin 评分(Modified Rankin Score)的评分,该评分描述中风后人的残疾程度。在真实世界的病历中,该评分常常记录得很晚,甚至根本没有记录。要求在把某人计入研究之前必须有该评分,导致许多早期死亡未被记录,使生存曲线在多年内人为地趋于平坦。当研究者移除这条单一规则时,那种奇怪的平台期消失,2014 年也不再显得特殊。在不同的截止年份中重复测试也显示同样模式:是入组规则的选择,而非日历日期,驱动了大多数药物效应差异。

Figure 2. 严格的入组筛选如何悄然延迟并排除早期死亡,从而改变两种心脏药物的表观安全性。
Figure 2. 严格的入组筛选如何悄然延迟并排除早期死亡,从而改变两种心脏药物的表观安全性。

利用大型健康数据的启示

该研究强调,从健康记录构建类似试验的研究不仅仅是复制日期和药物名称。每一条纳入和排除规则都必须被转换为数据,而这些数据可能不完整、延迟记录或只对部分患者可得。一条看似无害的规则在实践中可能正好过滤掉那些早期出现不良结局的人,从而倾斜治疗间的比较。作者认为,必须仔细测试每一项标准如何改变谁进入研究以及事件何时发生,以避免隐藏的选择偏倚。

这对患者和医生的意义

对于心力衰竭患者及其临床医生来说,这项工作并未推翻原始 WARCEF 试验或现行指南的结论。相反,它提供了一个关于我们如何解读试图模仿试验的“真实世界”研究的提醒。随时间出现的结果差异可能反映的是我们如何选择和监测患者,而非药物疗效的突然变化。若要使大型健康记录研究真正有助于日常护理,需以审慎的设计和透明的入组选择报告为要点。

引用: Li, X., Rajaganapathy, S., Hu, X. et al. From “negative” trial to positive clinical impact: mitigating eligibility criteria–induced temporal selection bias in emulated clinical trials. npj Health Syst. 3, 36 (2026). https://doi.org/10.1038/s44401-026-00082-3

关键词: 试验模拟, 入组标准, 心力衰竭, 华法林与阿司匹林, 电子健康记录