Clear Sky Science · zh

基于咳嗽声的深度学习算法:通过智能手机实现可及的慢性阻塞性肺疾病快速筛查

· 返回目录

把一次简单的咳嗽变成医疗线索

慢性肺病很常见,但诊断它们的工具通常需要到医院、使用笨重设备并由受训人员操作。这项研究探讨了一个更简单的思路:是否可以用普通智能手机录制的一段自主咳嗽来筛查可能患有慢性阻塞性肺疾病(COPD)的人?如果可行,数以百万计的人可以快速且低成本地接受筛查,尤其是在缺乏专业医疗资源的地区。

为什么COPD不易早期发现

COPD是一种长期性的肺部疾病,会导致呼吸困难,是全球重要的疾病与死亡原因。许多COPD患者并不知道自己患病,部分原因是早期症状常常模糊且容易被忽视。标准检测肺功能的肺活量测定(spirometry)衡量一个人呼出的气量,但它需要专用设备、受过训练的人员和配合的受测者。这些要求使其难以广泛使用,尤其在老年人和资源有限的门诊中。

仔细倾听咳嗽的声音

科学家已发现肺部问题会微妙地改变声音与咳嗽声。气道狭窄、炎症和黏液增多都会影响气流通过胸腔和咽喉时的声学特性。早期研究显示,简单的计算机程序可以识别与COPD、肺炎和结核等疾病相关的模式。然而,这些旧方法依赖人工挑选的声学特征和小规模数据集,限制了其在真实世界中的表现。

Figure 1. 智能手机录制的咳嗽声通过AI系统分析,以揭示可能的慢性肺病风险。
Figure 1. 智能手机录制的咳嗽声通过AI系统分析,以揭示可能的慢性肺病风险。

构建“咳嗽搜索”手机工具

作者开发了一个名为Cough Search的基于智能手机的系统,它监听自主咳嗽并判定这些咳嗽更可能来自COPD患者还是非COPD人群。首先,质量控制模块会过滤掉不可用的声音,例如清嗓声、背景噪音或不完整的咳嗽。剩余的咳嗽爆发被转换为称为声谱图的彩色声学图像,展示声音能量随时间和频率的分布。然后,这些声谱图被输入基于transformer技术的强大深度学习模型,模型被训练以识别COPD与非COPD咳嗽之间的差异模式。

在医院和门诊中测试该工具

研究团队在上海一家大型医院收集了超过2800名成人的咳嗽录音来训练和调优系统,然后在包括区级中心在内的四家医院进行了前瞻性测试。外部测试组共纳入722名受试者,其中105例确诊COPD,617例非COPD。与基于专家评审和呼吸测验的临床标准诊断相比,Cough Search在大多数情况下能正确区分COPD与非COPD。在外部组中,其受试者工作特征曲线下面积(AUC)达到0.94,敏感性约为92%(检测出真正患COPD的人),特异性约为86%(避免误报),内部测试也得到了相似结果。

Figure 2. 咳嗽声波被转换成彩色图谱,经过多层处理,最终以健康与病变肺部图标呈现。
Figure 2. 咳嗽声波被转换成彩色图谱,经过多层处理,最终以健康与病变肺部图标呈现。

在不同人群与设备上的表现如何

研究人员检查了该工具在年龄、性别、吸烟史和疾病分期上的公平性。对于病情更严重的患者,性能最强,晚期阶段的敏感性超过91%,中度疾病的敏感性也仍然较高。该模型在多种智能手机品牌以及一线和区级医院均能工作。但仍存在一些不均衡:在老年人、女性和极早期疾病患者中的准确率略低,某些其他肺部疾病(如支气管扩张)仍可能使系统混淆。对模型内部特征的分析显示,它主要依赖特定时间窗口和低频段的咳嗽成分,这与临床上关于COPD如何改变气流的认识相一致。

这对日常护理可能意味着什么

简而言之,这项研究表明,对着智能手机快速咳嗽一次就能提供一个出人意料的可靠信号,提示某人是否可能患有COPD,尤其是中度或重度疾病时。尽管它不能取代全面的医学评估或详细的呼吸功能测试,这类工具可以作为社区诊所、药房甚至家庭中的便捷初筛手段。以此方式使用时,Cough Search或许能缩短从出现首发症状到确诊之间的漫长延迟,让人们更早地开始管理肺部健康。

引用: Zhou, J., Huang, J., Wang, Q. et al. A cough sound-based deep learning algorithm for accessible prompt detection of chronic obstructive pulmonary disease with smartphones. npj Prim. Care Respir. Med. 36, 32 (2026). https://doi.org/10.1038/s41533-026-00486-6

关键词: 慢性阻塞性肺病, 咳嗽分析, 智能手机筛查, 深度学习, 呼吸健康