Clear Sky Science · zh

基于EEG的想象语言神经信号预处理与深度学习分类

· 返回目录

将无声的思维变为可能的语言

试想能在对方根本不动嘴唇的情况下“听到”他们所想的内容。对于瘫痪或无法说话的人,这类技术可能改变生活,让他们仅靠思维即可交流。本研究向这一目标迈出重要一步,展示了如何用简单的可穿戴帽测量的脑电波读取想象的词语。通过对信号进行精细清理并采用现代深度学习,作者证明静默想象的字母、数字和物体可以被相当可靠地识别。

Figure 1
Figure 1.

大脑信号如何成为通信通道

该工作聚焦于使用脑电图(EEG)的脑—机接口,EEG 是一种通过放置在头皮上的传感器记录微小电压变化的技术。与要求参与者移动手或想象动作不同,该系统监听人们在心里“说”词语时出现的大脑活动。在本研究使用的数据集中,志愿者想象了来自三类的30种不同项目:字母、数字和日常物品。每次试验持续十秒,并使用无线头戴设备从14个头皮位置采集信号,表明此方法可用消费级硬件而非外科植入设备实现。

在读取思维前清理信号

原始 EEG 记录很混乱。它们不仅捕捉到脑活动,还记录眼睛眨动、面部肌肉紧张和心跳,以及来自环境的电噪声。作者设计了一个六步预处理流程,尽可能去除这些杂波,同时保留与想象语言相关的模式。首先,使用一种数学方法将信号分解为独立成分,从而能自动去除类伪影部分。随后将数据转换到频域,在那里通过精心调谐的滤波器抑制某些麻烦的节律,避免扭曲时序。清理后的信号再转回时域,切分为短窗口并标准化,使所有通道共享共同尺度。数据的这一阶段性“洗涤与重塑”将混乱的轨迹变为学习算法可以理解的良好片段。

Figure 2
Figure 2.

让深度网络学习隐藏的模式

在这些预处理之上,团队测试了五种相关的深度学习模型,它们结合了两类神经网络。卷积层像小型模式探测器沿 EEG 通道滑动,捕捉空间和局部时间结构。长短期记忆(LSTM)层随后追踪这些模式随时间的演化,捕捉想象词语期间大脑活动的流动。一些模型仅向前看时间,而一个关键变体则前后双向观察,提供信号节律的更完整视角。通过比较这些网络设计,研究者表明结合卷积和双向 LSTM 能够对想象语言给出最有力的表征。

对系统进行现实情景测试

一个关键问题不只是模型能否解码已见参与者的思维,而是它是否对新个体有效。为此,作者采用了多种测试策略。简单的随机划分(过去研究常用)会给出非常乐观的结果:在完整流程下,最佳模型对30个想象项目的分类准确率超过99%。当采用更严格的方案以防止训练和测试数据之间的重叠时间片泄露时,性能仍保持较高。在最苛刻的“留一被试外”测试中,系统在大量志愿者上训练,然后在全新个体上评估(仅使用少量校准样本)。即便如此,它识别想象项目的正确率仍约为一项强劲近期比较模型的四倍,并且响应时间更快,支持实时交互。

这对未来无声语音设备意味着什么

对非专业读者来说,主要结论是想象语言解码不再是局限于小玩具词汇表的科幻幻想。通过对 EEG 信号的积极清洗并将其与智能的双向深度网络配对,本研究表明头戴设备可以可靠地区分30种不同的静默想象项目,即便迁移到新用户也能保持效果。尽管将完整的自由形式思维转化为流畅语音仍需更大词汇量和更先进的设计,但这项工作提供了坚实基础:它证明了通过正确的预处理和学习策略,大脑对未说出口单词的低声呢喃可以被转为清晰、机器可读的信号。

引用: Elwasify, F., Shaaban, E. & Abdelmoneem, R.M. EEG imagined speech neuro-signal preprocessing and deep learning classification. Sci Rep 16, 10604 (2026). https://doi.org/10.1038/s41598-026-39395-6

关键词: 想象语言, EEG 脑—机接口, 深度学习, 信号预处理, 神经解码