Clear Sky Science · zh

使用基于Transformer的序列到序列模型与知识蒸馏的未来感知血糖预测

2026-02-28 · 返回目录

为何预测血糖很重要

对于1型糖尿病患者，餐后、运动、压力或胰岛素给药后血糖会迅速升降。能看到的不仅是当前血糖值，而是未来一两小时的变化趋势，能帮助他们避免危险的低血糖或高血糖，及时调整胰岛素，并更有把握地安排日常活动。本研究探索了一种新的方法，让计算机在训练时秘密使用有关即将发生的进食和胰岛素的信息来预测未来血糖，同时在实际运行时仍能在未来未知的情况下工作。

为糖尿病护理提供更智能的前瞻

如今的连续血糖监测仪每几分钟记录一次读数，现代算法也已利用这些数据预测近期血糖。然而大多数现有工具只向后看：它们分析过去的血糖读数，有时还包括心率或活动等其他信号。它们通常忽略未来事件（如下一餐或胰岛素注射）带来的强烈影响，因为这些事件在运行时并不可靠。结果是，预测常在血糖剧烈波动时失准，例如餐后或矫正高值时。作者认为，要真正支持日常糖尿病决策，预测必须以某种方式学习有关这些未来干扰的信息，而不是期望在运行时能获得它们。

用额外线索教学，然后无该线索下测试

研究者提出了一种“未来感知”的学习框架，把训练与部署分离。在训练期间，他们利用两套大规模1型糖尿病人群的数据记录，这些记录包括血糖读数、胰岛素剂量和进食信息。他们构建了一个强大的“教师”模型，基于Transformer——一种擅长处理长序列的深度学习架构。该教师模型同时看到过去的血糖数据和接下来两小时的进食与胰岛素信息，并学习这些未来事件如何塑造血糖模式。与此同时，他们设计了一个结构相似的“学生”模型，但学生在任何时候只看到过去的数据，就像现实设备一样。

将知识从教师传递给学生

为弥合这两种世界观之间的差距，作者使用了一种称为知识蒸馏的技术。他们不仅让学生匹配教师的最终预测，还要求学生模仿教师对血糖演变的内部表示。教师和学生都将其内部信号送入同一解码器网络，将抽象模式转换为未来血糖曲线。在训练过程中，学生同时受到三方面的推动：必须预测真实的未来血糖、必须使其内部模式接近教师的内部模式、并且必须逼近教师的预测。随着时间推移，学生学会间接“思考”即将发生的进食和胰岛素，从最近历史的形态中推断可能的未来波动。

在真实糖尿病数据上测试

研究团队在两套独立数据集上评估他们的方法：OhioT1DM（跟踪12名成人八周的日常生活）和AZT1D（跟踪25名使用自动胰岛素输注系统的人）。在对缺失传感器读数进行谨慎处理后，他们将学生模型与若干强基线神经网络进行比较，包括LSTM、双向LSTM、卷积-循环网络以及未采用未来感知训练的Transformer模型。在30到120分钟的预测时长范围内，该新方法持续降低了常见误差指标，如均方根误差和平均绝对误差。通过Clarke误差网格评估临床可靠性，该网格按预测可能在决策中造成的危害对其进行分级；该模型超过90%的预测落在被认为对治疗指导安全或可接受的区域。

这对日常生活的意义

简而言之，研究表明允许模型在训练时偷看未来，然后将这种经验蒸馏到一个在无未来信息下仍能运行的精简版本，可以使血糖预测更准确——尤其是在60到120分钟这一范围内。这些较长的预测时段有助于人们决定是否现在吃点零食以避免随后低血糖，或是否及时调整胰岛素剂量以预防即将到来的高血糖。尽管该工作仍属研究阶段并假设相当规律的日常模式，但它指向了更智能的决策支持工具和闭环胰岛素系统，这些系统即便只能访问已有信息，也能更好地预判即将到来的血糖波动。

引用: Sun, X., Li, H. & Yu, X. Future-aware blood glucose forecasting using knowledge distillation with transformer-based sequence-to-sequence models. Sci Rep 16, 11404 (2026). https://doi.org/10.1038/s41598-026-41787-7

关键词: 血糖预测, 1型糖尿病, 深度学习, Transformer 模型, 知识蒸馏