Clear Sky Science · zh

通过基于GAN的插补克服可穿戴设备疾病检测中的数据丢失

· 返回目录

为什么可穿戴设备的缺失数据很重要

健身追踪器和智能手表有一个诱人的承诺:如果它们能在我们感觉不适前几天就发出感染警报,会怎样?在世界许多地区,尤其是医疗点和实验室稀缺的农村地区,这种早期预警可能意味着轻微病情与危险病情之间的差别。但在现实中,人们会忘记戴设备、电池会耗尽、网络连接会中断。本研究解决了一个简单但关键的问题:我们能否足够好地挽救那些中断的数据流,从而仍能发现疾病的早期迹象?

Figure 1
Figure 1.

把缺口变成有用信号

研究人员关注的是腕戴设备的心率数据,因为夜间的静息心率在症状出现前往往会微幅上升。他们没有丢弃缺少读数的夜晚,而是使用一种称为生成对抗网络(GAN)的人工智能来填补空白。可以把GAN想象成一个非常擅长猜测的模型,它学会了典型的日常心律模式,并能重建缺失时段可能发生的情况,同时仍然允许由感染引起的异常变化出现。

在两种截然不同的疾病中检验这一思路

为了验证这一方法在真实世界中的可行性,团队研究了两大组人群。一组是美国的COVID-19队列,超过3000名参与者,通常有较为可靠的可穿戴数据。另一组是肯尼亚西部农村的较小疟疾队列,由于充电、连接和佩戴时间等问题,只有约一半预期的心率读数实际被记录。令人惊讶的是,GAN仅在COVID-19数据上训练,却仍能在不进行再训练的情况下重建出在疟疾组中看起来可信的心率模式。

在肯尼亚农村发现隐匿感染

在肯尼亚的疟疾研究中,300名成人佩戴腕带,现场工作人员定期对他们进行疟疾检测并收集症状日记。作者将GAN重建的夜间心率与一个简单的基于规则的系统结合,该系统监测持续高于个人基线的升高。在161例疟疾感染中,他们的系统提前发出了100例警报,其中42例如果不填补缺失数据根本不会发生。平均来看,这些警报出现在人们报告症状前约12天,几乎与疟原虫在血液中增殖所需的已知时间相匹配。即使数据大量缺失,警报在感染窗口期通常会连续出现约3.5天,这增加了卫生工作者注意并采取行动的可能性。

Figure 2
Figure 2.

在准确性、清晰性与实用性之间的权衡

团队将GAN与常见的填补缺口方法进行了比较,从像向前携带最后一个值这样非常简单的方法到更高级的统计模型。在两种疾病组中,GAN通常产生最准确的重建,并更好地保留自然的昼夜心率节律,即使在超过70%的数据缺失时也是如此。当这些改进后的信号被输入自动感染检测模型时,灵敏度(捕捉真实病例)和精确度(避免误报)都提高了。与此同时,GAN被设计为轻量且快速,以便将来能够在电力和连接受限地区的基础计算机或边缘设备上运行。

这对日常护理意味着什么

对非专业人员来说,关键结论是:可穿戴设备的缺失数据不仅仅是可以抛弃的噪声。通过合适的智能重建,这些空白可以转化为有意义的警示信号。本研究表明,在一种疾病(COVID-19)上训练的AI模型可以帮助在非常不同的环境中检测另一种疾病(疟疾),在许多情况下为卫生工作者提供一周或更长时间的提前通知。如果安全且符合伦理地部署,此类系统可以帮助社区卫生工作者决定何人需要检测、何时上门以及如何优先分配稀缺资源,从而把护理从对全面发病的被动应对,转向在仍有时间干预时悄然发现感染。

引用: Wallner, J., Berbuir, S., Birner, L. et al. Overcoming Data Loss in Wearable Disease Detection with GAN-Based Imputation. npj Digit. Med. 9, 275 (2026). https://doi.org/10.1038/s41746-026-02518-4

关键词: 可穿戴传感器, 传染病检测, 疟疾, 缺失数据插补, 低资源环境下的数字健康