Clear Sky Science · zh

从睡眠分期到纺锤体检测：端到端自动化睡眠分析的个案研究

2026-05-23 · 返回目录

为什么更快的睡眠研究很重要

睡眠检测可以揭示大脑在夜间的活动方式，为抑郁、双相情感障碍和记忆问题等疾病提供线索。然而，对这些记录进行详细评分极为耗时，导致许多研究规模小且完成缓慢。本文提出了一个影响深远的简单问题：计算机能否像人类专家那样可靠地分析睡眠记录，并且足够快以推动更大规模的研究？

夜间实验室内的观测

在典型的睡眠研究中，受试者在实验室过夜，同时通过传感器记录他们的脑电波、眼球运动和肌肉活动。随后，受过训练的专家将信号按30秒片段查看并标注大致的睡眠分期，比如浅睡和深睡。除此之外，他们还会识别短暂事件，比如与学习和脑健康相关的睡眠纺锤体——短时段的脑活动爆发。作者关注两个关键问题：现代计算模型能否准确分配睡眠分期？然后它们是否能够足够准确地检测纺锤体，以检验关于精神疾病的科学假设？

Figure 1. 计算机如何将整夜脑电波记录快速转化为可用于大规模研究的全自动睡眠报告。

教机器读懂脑电波

团队使用了两种最先进的深度学习模型。一种名为 RobustSleepNet 的模型处理长时间段的脑电数据，并将每个短片段标注为觉醒或若干睡眠分期之一。另一个模型 SUMOv2 检查轻度非快速眼动睡眠的片段，标注纺锤体出现的精确时刻。两种模型均在大型既有数据集上训练，且在本案例研究中从未见过包含双相障碍的记录，使得此次测试更接近它们在真实诊所和研究项目中的实际应用情景。

与人类评分者相匹配甚至超越

为评估模型是否值得信赖，作者将模型的判定与多位人类专家的判定进行了比较。在睡眠分期方面，计算机的标注与专家的协议程度与不同专家之间的互相一致性相当，在一个大型数据集中，该模型甚至比典型的一对评分者更接近群体共识。在纺锤体检测方面，SUMOv2 达到的协议水平位于或超出人类评分者之间通常观察到的一致性范围，且在与多个评分者的组合共识比较时表现尤为出色。这些验证表明自动化工具正在以专家水平运行，而非提供粗略的捷径。

Figure 2. 一个两步计算管道如何筛选睡眠分期、检测纺锤体爆发，并比较两个群体间的强度差异。

模型揭示的双相情感障碍相关发现

借助这些自动化工具，研究人员重新分析了此前一项比较双相障碍患者与健康志愿者的数据。在原始研究中，专家手工标注睡眠分期和纺锤体耗时数月，发现双相患者在每分钟浅睡中出现的快速纺锤体较少，这一模式可能作为该疾病的一个标志。自动化管道复制了患者组与对照组之间快速纺锤体密度的这一关键差异，并且也重现了更细微的趋势，例如患者的纺锤体频率略低，尽管并非所有细节在新的分析中均达到了统计显著性。

为更大、更公平的睡眠研究铺路

尽管自动计数和精确数值并非在每一方面都与原始专家结果完全一致，但总体模式相似，且模型的表现与人类专家之间典型的不一致性相当或更优。这表明在检验某些科学问题时，特别是关注群体差异而非单个患者时，完全自动化的管道可作为手工评分的替代。作者通过开放其代码和一个名为 SomnoBot 的隐私保护在线工具，旨在帮助全球研究者快速且一致地分析睡眠记录，从而为研究睡眠紊乱与大脑健康关系的更大规模研究打开大门。

引用: Grieger, N., Mehrkanoon, S., Ritter, P. et al. From sleep staging to spindle detection: a case study on end-to-end automated sleep analysis. Sci Rep 16, 16014 (2026). https://doi.org/10.1038/s41598-026-53891-9

关键词: 睡眠分析, 脑电图 (EEG), 睡眠纺锤体, 双相情感障碍, 深度学习