Clear Sky Science · zh

使用机器学习和基线健康信息预测2型糖尿病患者未来肾功能

· 返回目录

这对糖尿病患者为何重要

对于许多2型糖尿病患者而言,一个长期的重大担忧是肾脏是否会逐步衰竭,最终需要透析。医生可以测量当前的肾脏健康状况,但要在多年之前判断谁的肾脏最有风险则困难得多。本研究探讨了计算机模式识别(即机器学习)能否利用单次常规检查的数据来预测多年后的肾功能表现。

Figure 1
Figure 1.

一种常见但无声的危险

糖尿病肾病约影响四成2型糖尿病患者,是全球慢性肾功能衰竭的主要原因之一。肾功能通常用估算肾小球滤过率(eGFR)来追踪,它反映了肾脏滤血的效率。有些患者肾功能下降很快,而有些则缓慢下降或多年保持稳定。由于早期通常没有症状,临床上需要更好的方法尽早识别那些“快速衰竭者”,以便通过额外监测和治疗在早期减缓或防止严重损害。

把体检数据变成水晶球

研究者随访了在日本三所医院接受治疗的974名2型糖尿病成年人,中位随访时间略超过五年。起始时收集了54项在糖尿病门诊常规测量的信息,包括年龄、血压、体重、血液检查、尿液检查和当前肾功能。重要的是,他们不依赖未来的检测结果或专门的基因/蛋白标志物——仅使用初诊时通常可获得的数据。然后让一组计算模型学习这些起始测量值与随后每年随访中观察到的eGFR数值之间的关系,最长可达九年。

智能模型的表现如何

团队比较了三种现代机器学习方法——Light Gradient Boosting Machine、随机森林和支持向量机,与一种传统的统计方法多元线性回归。所有方法总体表现都不错,但支持向量机脱颖而出。它在整个肾功能范围内提供了最准确的预测,尤其对起始时肾功能仍然较好的人更为准确。仅使用初次检查数据加上预测的年数,该模型在大约六年内能保持中等准确性,而传统方法的预测在四年后变得不可靠。

Figure 2
Figure 2.

是什么驱动了这些预测

为了解析这些“黑箱”模型,研究者使用了一种解释工具来排序哪些基线特征最重要。如预期,当前的肾功能指标——eGFR本身和血肌酐——影响较大,此外还有年龄和尿液中的肾损伤标志物。血脂、贫血相关指标和某些肝功能相关酶类也起到重要作用。在不同亚组(例如老年人或女性)中,出现了稍有不同的模式,表明某些风险因子对特定患者可能更为重要。即便将模型简化为仅包含最具信息量的因素,其性能变化也很小,这对最终在临床应用中推广是一个积极信号。

从预测到可行的行动

该研究有其局限性:所涉为相对较少的日本门诊人群,尚未在其他国家或医疗体系中验证,并且假设患者的许多生活和治疗方面随时间保持相对稳定。尽管如此,研究结果表明有可能将一次普通的糖尿病门诊变成对多年肾功能的个体化预测。未来,这类工具可集成到电子病历中,用以标记预测肾功能将显著下降的患者,促使更密切随访、更早转诊肾脏专科以及更及时使用保护性治疗。简言之,更聪明地利用现有数据可为患者和临床医生在保护肾脏健康方面赢得宝贵先机。

引用: Unoki-Kubota, H., Nakajima, K., Shimizu, Y. et al. Predicting future kidney function in type 2 diabetes mellitus using machine learning and baseline health information. Sci Rep 16, 10890 (2026). https://doi.org/10.1038/s41598-026-45500-6

关键词: 糖尿病肾病, 2型糖尿病, 肾功能下降, 机器学习预测, eGFR