Clear Sky Science · zh
SynthEHR-eviction:使用大模型增强的合成电子病历数据改进驱逐相关社会健康决定因素检测
为何住房困境应写入病历
被迫离开住房会严重损害健康,然而大多数医疗系统几乎注意不到这种情况发生。本文介绍了一种新的方法,用以教人工智能在医生记录中识别出驱逐及相关社会困境的迹象。通过将少量专家工作扩展为大量、现实的训练样本,该方法有望帮助医疗系统更早发现有风险的人,并将他们与住房及社会支持资源对接。
失去家园何以危及健康
驱逐不仅仅意味着地址改变。它与无家可归、失业、抑郁甚至更高的死亡率有关,尤其对边缘化群体和在诸如 COVID-19 这样的危机期间影响尤为严重。然而在当今的电子健康记录中,有关失去住房或面临驱逐威胁的信息通常只出现在自由文本的病程记录中,而非标准的复选框或编码中。这使得医院、研究人员和政策制定者难以看清驱逐发生的地点、受影响最深的人群以及何时应该介入。
构建逼真的“合成”患者故事
由于明确提及驱逐的真实病历笔记稀少且敏感,作者们构建了名为 SynthEHR‑Eviction 的流程,以生成现实但完全合成的示例。他们从真实住院出院记录的社会病史部分入手,使用大规模语言模型——在海量文本上训练的人工智能系统——对其重写,使每条记录反映出特定的住房或社会情境。专家们仔细定义了14个类别,包括诸如“待决(pending)”、“双方同意终止租约”和“过去驱逐与当前驱逐”的详细阶段,以及无家可归、食物不安全和付账困难等相关问题。通过迭代的人机交互过程,临床专家审查样本输出、标记错误,并将结构化反馈回馈到提示设计中,直至每个 AI“增强器”产出高度准确且歧义最小的笔记。最终得到的大型公共数据集包含8000条合成训练笔记,以及600多条精心标注的测试笔记,这些测试笔记将合成案例与从主要研究数据库中提取的去标识化真实样本混合在一起。

教计算机读懂含蓄表达
在这些合成故事之上,团队构建了一个自动注释系统,该系统不仅分配类别,还生成其推理过程的逐步解释。借助名为 DSPy 的框架,他们优化了提示,使得 AI 首先判断一条记录是否与驱逐有关,然后将其分别送入详细的驱逐分类器或针对交通、食物不安全等其他社会风险的分类器。该设计类似于人类读者先问“是否提到驱逐?”然后再将案例归入更具体的类别。为减少人工工作量,研究人员将对8000条笔记进行完整人工改写和标注(超过260小时)的工作与他们的 AI 辅助流程进行了比较,后者在不到6小时的专家投入下达到了可比的数据质量,工时减少了约80%。
模型的表现如何
借助 SynthEHR‑Eviction,作者随后对一系列开源语言模型进行了微调,并将其与商业系统及早期生物医学模型进行了比较。在判断是否提及驱逐这一简单任务上,许多模型表现良好,但微调的大型语言模型和经调优的 GPT‑4 变体取得了最高分。更困难的测试是区分七种细微的驱逐状态以及一组独立的非驱逐社会风险,测试数据来自三类数据集:合成笔记、真实医院笔记和冗长的学术病例报告。在此情境下,经微调的开源模型如 Qwen2.5 和 LLaMA‑3 的表现与经优化的 GPT‑4 相当或略有超越,在驱逐分类上达到约 0.89 的宏 F1 分数——精确率与召回率的总体平衡——在其他社会风险上则超过 0.90。经微调后仅有 30 亿参数的小模型也表现良好,这表明在计算资源有限的环境中也能部署能力强且成本可控的系统。

为何推理痕迹与真实数据仍然重要
研究显示,解释性信息对某些模型帮助更大。当训练数据包含简短、明确的关于为何某条记录表明某种驱逐状态的推理时,较小的模型明显改进,而最大的模型变化不大,暗示它们已内含相当多的此类逻辑。这些推理痕迹也使专家更容易审查模型决策,但作者提醒,解释并不总是完美忠实地反映模型的真实决策过程。另一个关键发现是,仅用合成笔记训练的模型在面对凌乱的真实世界写作时会出现失误。只需在训练中混入少量真实医院或病例报告笔记,就能显著改善在这些领域的表现,强调了合成数据虽有强大作用但并非万无一失。
从隐匿风险走向可见援助
总体而言,文章表明,精心设计的合成数据结合有针对性的专家监督,能够将零散提及的驱逐和其他艰难处境转化为可被计算机在规模上检测的结构化信号。通俗地说,该系统学会读懂医生笔记中的言外之意,并在患者正面临或曾面临住房丧失或相关社会压力时进行标记。如果将此类工具整合进电子健康记录,临床医生与社会工作者就能更早识别有风险的人,并将他们与住房援助、财务咨询或交通支持等服务对接。通过让疾病的社会面更可见,SynthEHR‑Eviction 为以更全面的方式认识并回应患者生活处境的医疗保健提供了一条路径。
引用: Yao, Z., Zhao, Y., Mitra, A. et al. SynthEHR-eviction: enhancing eviction SDoH detection with LLM-augmented synthetic EHR data. npj Digit. Med. 9, 292 (2026). https://doi.org/10.1038/s41746-026-02473-0
关键词: 驱逐, 社会健康决定因素, 电子健康记录, 合成数据, 临床自然语言处理