Clear Sky Science · zh
利用真实世界数据评估移动健康应用有效性的范围审查
你的健康应用为何超越手机本身的重要性
我们很多人现在在健康应用中记录情绪、睡眠、步数或血糖,但所有这些信息最终会怎样被利用?本文探讨了来自移动健康(mHealth)应用的真实世界数据如何被用来评估这些工具在日常生活中是否真正对人们有帮助。作者没有仅依赖传统临床试验,而是审视了那些利用人们在家中、工作中和外出时自然使用应用所产生数据的研究。

研究者希望发现什么
作者开展了一项范围审查,一种广泛的映射性研究,旨在了解已发表研究中如何使用来自健康应用的真实世界数据。他们聚焦于面向患者的应用,即人们独立使用以管理健康、追踪病情或支持生活方式改变的应用。关键在于,他们只纳入使用“自然产生”数据的研究——通过应用的常规功能或日常医疗记录捕获的信息,而非为研究额外设置的问卷或工具。他们将这些数据大致分为三类:用户手动输入的信息、由传感器或可穿戴设备自动记录的数据,以及来自医疗系统(如电子健康记录或保险理赔)的信息。
健康应用在哪里经受检验
在一万多篇论文中,研究团队识别出72项符合条件的研究,涉及61款不同的应用。大多数应用针对精神健康问题(如抑郁或失眠)或代谢相关问题(如糖尿病和体重管理)。许多应用在实践中充当医疗工具,帮助指导治疗或日常决策,尽管它们的官方监管地位并不总是被明确报告。精神健康类应用倾向于大量依赖用户输入的情绪、睡眠或症状等信息,而代谢类应用则更常依赖连接设备,例如血糖监测仪或自动记录测量值的智能体重秤。
这些应用实际使用了什么类型的数据
审查发现,大多数研究依赖主动输入的信息,例如应用内的症状调查,较少充分利用来自传感器或医疗系统的被动数据。大约七成研究使用用户输入的数据,通常是关于疼痛、情绪或睡眠的评分。约四分之一使用设备生成的数据,只有少数研究将医疗记录或保险理赔数据纳入分析。许多应用持续或频繁地收集信息,但研究者对这类丰富数据流的分析方式常常出人意料地有限。很少有研究整合多种数据源——例如将自我报告的幸福感与传感器读取相结合——尽管这种组合有望提供更全面、更可靠的健康图景。

到目前为止证据有多强?
在审视研究设计时,作者发现大多数研究相对简单,属于单组的前后对比,缺乏可对照的对照组。只有少数研究采用更严格的方法,例如将应用用户与相似的非用户进行比较,或实施更贴近实际护理的务实随机试验。因此,许多现有研究可以显示在使用应用期间人们的症状发生了变化,但无法有力地断言这些变化是由应用本身引起的。研究规模差异很大,从几十人到数十万人不等,随访通常仅持续数月,这意味着长期影响仍然知之甚少。
这对患者与未来数字医疗意味着什么
总体而言,这项审查描绘出一个充满希望但尚未完成的图景。健康应用显然能够捕捉大量关于人们感受与功能状态的真实世界信息,这些数据有潜力支持对数字工具上市后性能的持续、灵活评估。然而,到目前为止,大多数已发表研究仅部分利用了这种潜力:它们高度依赖自我报告,使用有限的研究设计,且很少将应用数据与临床记录关联。为了让临床医生、监管者和患者更有信心,未来的评估需要融合不同类型的真实世界数据、延长随访时间并采用更好的对照方法。若能做到这一点,日常应用使用将有可能成为发现数字医疗真正有效之处的强大学习引擎。
引用: Gehder, S., Brückner, S., Gilbert, S. et al. A scoping review on using real-world data to evaluate the effectiveness of mHealth applications. npj Digit. Med. 9, 309 (2026). https://doi.org/10.1038/s41746-026-02562-0
关键词: 移动健康应用, 真实世界数据, 数字治疗, 健康数据研究, 循证移动健康