Clear Sky Science · zh

使用离线强化学习进行肝移植供体-受体匹配

2026-03-16 · 返回目录

为何这些肝移植决策至关重要

对于重度肝病患者，接受移植可能意味着生与死的差别——但供体肝脏远远少于需要移植的患者数。医生必须不断决定是否为某位患者接受一具特定的肝脏、继续等待更合适的匹配，或在患者病情好转或恶化至无法移植时将其从等待名单上移除。本研究探讨了一种称为离线强化学习的人工智能方法，是否能从多年移植数据中学习，提出更安全、更明智的匹配决策，从而挽救更多生命并更好地利用每一具捐献器官。

从一次性预测到持续性的决策

目前大多数用于肝移植的工具只考虑单一时间点——例如手术当天——并估计患者在接受某个供体器官后的生存几率。它们常依赖诸如终末期肝病模型（MELD）之类的评分，将化验结果汇总为一个数字以帮助优先排序最危重的患者。但这些工具忽略了一个关键事实：患者病情会在数周或数月内变化，每一次接受或拒绝器官的决定都会影响后续情况，包括在等待名单上死亡的风险。作者把移植问题重新框定为一系列随时间演进的决策，其中每次选择移植、等待或移出名单都会导致不同的未来路径。

教计算机从过往移植选择中学习

研究者使用了美国移植受者科学登记处（Scientific Registry of Transplant Recipients）的记录，重点关注2017年至2022年间超过43,000名列入首次肝移植等待名单的成人。对每位患者，他们重建了MELD评分和可能的供体器官提供时间线，包括最终被弃用的器官。在每个步骤，计算机看到患者特征、潜在供体特征以及三种可选动作：等待、移植或从名单上移除。随后系统根据后续实际发生的情况获得奖励信号——例如患者病情是好转还是恶化、是否发生了移植、移植是成功还是失败，或根本未发生移植。研究者使用一种名为保守Q学习（Conservative Q-learning）的技术训练系统，使其在大量此类时间线上偏向那些能导致更少死亡和更少移植失败的决策。

学得的策略会带来哪些改变

当在一组独立患者上测试该训练好的系统时，它回避了73%的在现实中导致移植后一年内移植片功能衰竭或死亡的供体—受体配对，同时保留了93%的成功移植。它还为近一半在等待名单上死亡的患者识别出了更早的移植机会，提示不同的时机或供体可能会改善这些患者的生存机会。重要的是，与那些一旦患者足够病重就几乎普遍移植的激进策略不同，该方法在减少总体移植数量的同时仍提高了结局。在更现实的模拟中（每具供体肝仅能使用一次，患者在移植或移出后离开候选池），模型仍设法将大多数患者与供体匹配，同时减少可避免的失败。

数据中隐藏的更好匹配线索

除了原始性能指标外，团队还检查了系统倾向选择的供体—受体类型。与基于简单MELD规则相比，学到的策略更倾向于选择病情相对不那么危急的患者，以及在历史上与成功移植更相似的供体——边缘器官更少，且需要重症生命维持的受体更少。引人注目的是，它还拯救了实践中被弃用但似乎质量相对较好的一部分肝脏。模型在被标准评分标注为“高风险”的分组内所做的移植选择与更好的实际生存相关，尽管这些标准评分本身并无差异，这暗示算法捕捉到了现有工具未能识别的复杂模式。

这对患者和医生意味着什么

这项工作尚未提供一个可直接床边使用的系统，但它表明一种完全基于历史数据训练的AI方法能够更贴近肝移植中面临的真实权衡——在等待太久的危险与使用不佳匹配的风险之间取得平衡。通过学习何时对每一次器官提供说“是”、“不”或“暂缓”，该方法在模拟中减少了移植失败，同时保留了大多数成功案例，并为许多可能在等待名单上死亡的人提供了潜在的救命机会。经过进一步优化、更好的数据支持和严格测试，类似的决策支持工具有望帮助移植团队更明智地使用每一具捐献肝脏，让更多患者获得持久的第二次机会。

引用: Melehy, A., Feng, J., Amara, D. et al. Liver transplant donor-recipient matching with offline reinforcement learning. npj Digit. Med. 9, 351 (2026). https://doi.org/10.1038/s41746-026-02529-1

关键词: 肝移植, 器官分配, 强化学习, 医疗人工智能, 供体受体匹配