Clear Sky Science · zh
一种新方法用于子痫前期早期预测,解决临床数据集缺失带来的预测不确定性
这对母婴意味着什么
子痫前期是妊娠期间的一种危险并发症,可能突然威胁到母亲和胎儿的生命。医生已知一些简单措施,例如在妊娠早期给予低剂量阿司匹林,可以大幅降低可能发展为该病的女性的风险。挑战在于及时识别那些高风险妊娠,并在现实世界中病历常常不完整的情况下可靠地做到这一点。本研究提出了一种新的方法,能够在早期预测子痫前期,同时向医生说明每次预测应有多大信任度。
了解这一沉默的妊娠威胁
子痫前期影响全球2–8%的妊娠。它通常在妊娠后期出现,但其根源往往在更早阶段就已形成。患子痫前期的母亲可能遭受肾、肝、脑等器官损伤,在最严重的情况下母婴均可能死亡。胎儿可能停止正常生长或需极早诱导分娩。由于在妊娠16周前开始低剂量阿司匹林可以将早发性子痫前期的风险降低一半以上,能够在第一孕期识别高风险妇女可能会彻底改变护理方式。然而,仅依靠临床医生的经验在这类高风险决策中被证明不够可靠。

将零散的病历变成有用的预警
过去十年间,许多研究团队使用机器学习方法从常规门诊和实验室信息中预测子痫前期。这些模型通常达到中等准确性,但它们都有一个主要问题:即假设每次预测同样可信,哪怕患者记录中缺少关键检测结果。在真实的产前护理中,血液检查和随访就诊经常被省略,尤其是在繁忙的门诊环境中。这导致大型医院数据库充满空白。早期研究大多忽视了这些空白如何影响每次预测的置信度,这可能掩盖了这些模型的真实潜力。
为风险评分添加“诚实计”
研究者分析了来自韩国三家医院的3.1万多例单胎妊娠病例,使用在妊娠16周前收集的信息。他们建立了一个输出介于0到1之间子痫前期风险评分的预测模型。随后他们增加了第二个数字:不确定性评分,反映缺失信息可能对该预测造成的影响。为此,他们考察了在数据完整的女性中每个临床或实验室变量通常如何强烈地推动风险上升或下降。那些对模型影响较大的变量——例如平均动脉压、距上次妊娠的长间隔或初产、某些与妊娠相关的蛋白质以及高密度脂蛋白胆固醇——被评为更重要。如果某位女性缺少这类关键变量,她的不确定性评分会比缺少不太重要项时上升得更多。
只信任更清晰信号会怎样
有了不确定性评分后,团队评估当仅关注数据相对完整且信息量大的妊娠时模型的表现。在内部测试中,当忽略不确定性并使用所有女性时,模型区分谁会或不会发生子痫前期的能力良好但并不出众。当他们逐步将评估限制在不确定性评分较低的女性(即缺失值较少或不那么关键)上时,准确性稳步提升。在适度的不确定性水平下,模型的表现已优于先前报道;在非常低不确定性时,其准确性显著提高,能够在低误报的情况下几乎识别出所有未来的子痫前期病例。当该模型在独立医院的数据上测试时出现了类似模式,表明这种方法在不同诊所和患者群体间也具有稳健性。

对更好检测和未来护理的启示
由于该方法跟踪每个变量对不确定性的贡献,它可以指导哪些测量在妊娠早期最值得采集。分析显示不存在单一足够的检测:许多变量各自贡献少量但重要的信息。该框架具有灵活性,可与其他更复杂的机器学习模型配合,或扩展到其他罕见的妊娠问题。同时,作者提醒这项工作属探索性,主要基于韩国单胎妊娠女性,且最令人印象深刻的准确性估计来自样本小且不确定性很低的子群,在这些子群中子痫前期病例非常少。在这样的工具可用于真实世界护理之前,还需要更多多样化的研究和决策阈值的谨慎选择。
这对准父母意味着什么
本研究尚未提供可在门诊使用的测试,但它指向了更智能、更透明的预测工具。未来的系统不仅可以给出一个风险评分,还可以说明其确定性,帮助医生在重要信息缺失时避免过度自信。通过了解哪些常规测量最重要以及如何处理不完美数据,这项工作为更安全、更早地识别有子痫前期风险的妊娠奠定了基础——为保护母婴健康争取更多时间。
引用: Kim, J.W., Kim, N., Kim, J.Y. et al. A novel approach to preeclampsia early prediction addressing predictive uncertainty due to missing data in clinical dataset. Sci Rep 16, 8455 (2026). https://doi.org/10.1038/s41598-025-27801-4
关键词: 子痫前期, 妊娠风险预测, 产科中的机器学习, 临床数据不确定性, 孕产妇健康