Clear Sky Science · zh

一种基于逻辑知识驱动的双向多注意力GRU框架用于人类恐惧等级分类

· 返回目录

为何从身体读出恐惧很重要

恐惧不仅仅是胃里的一种感觉——它会重塑你的心跳、出汗,甚至脑电波。如果计算机能够可靠地读取这些微妙变化,治疗师可以实时跟踪焦虑,汽车和机器人在有人恐慌时能做出应对,虚拟现实则可自适应以保护用户安全。本研究探讨如何通过结合大脑与身体的信号以及一种结构化的基于规则的推理,教会机器识别人类不同程度的恐惧,目标是构建既准确又对人类可理解的系统。

Figure 1
Figure 1.

听取大脑与身体的信号

研究者出发点是没有单一测量可以完全捕捉恐惧。因此他们汇集了多种生理信号:来自大脑的电活动、随出汗而上升的皮肤电导、心律变化、呼吸模式以及面部动作。使用了两个现有的实验数据集:一个名为 DEAP,在观看音乐视频并对愉悦度与强度进行评分时记录人们的脑与身体信号;另一个 DECAF,在人们观看引发恐惧的电影片段或聆听音乐时记录脑成像与身体传感器数据。这些多模态数据集提供了恐惧如何在神经系统各处表现的丰富图景。

将原始信号转为简单规则

原始信号本身嘈杂且难以解释,因此团队将其蒸馏为与情绪已知相关的特征。例如,他们计算“额区α波不对称”,这是左右额叶脑电中常与负性情绪相关的模式,并统计皮肤电反应中的峰值,这些峰值往往随压力上升。他们还将脑信号分解为经典频段——δ、θ、α、β 和 γ,并总结心率变异性。研究组并未把这些连续数值直接输入黑箱模型,而是引入基于逻辑的学习:使用统计选择的阈值将每个特征判定为“高”或“低”。基于这些二元构件,一种称为归纳逻辑编程的算法发现可读的 IF–THEN 规则,例如高皮电反应与低心率变异性的组合通常可靠地指示恐惧。

Figure 2
Figure 2.

将规则与深度学习结合

尽管逻辑规则使决策更易解释,但现代深度学习模型在从复杂数据中挖掘预测能力方面更为出色。因此作者将逻辑输出作为若干为时变信号设计的神经网络架构的唯一输入。这些架构包括标准循环网络、长短期记忆网络(LSTM)、更简洁的门控循环单元(GRU),以及一种先进设计——双向多注意力 GRU。该模型不仅在序列中前后查看,还使用注意力机制聚焦于最具信息性的时刻,例如皮电的尖峰或脑节律的突变,同时忽略次要波动。

系统读取恐惧的效果如何

为检验方法,团队比较了在有无基于逻辑层情况下基于相同输入训练的模型表现。他们评估模型在区分无恐惧与有恐惧方面的准确性,并在 DEAP 数据集中测试区分从无恐惧到高度恐惧的四个等级。通过广泛的交叉验证和统计检验,加入逻辑规则持续提升了性能,并使结果在不同测试划分间更稳定。表现最突出的架构——知识驱动的双向多注意力 GRU,在 DEAP 数据集上达到约 96.7% 的准确率,并在 DECAF 的音乐片段上表现出类似的高性能,优于若干先前发表的方法和更传统的机器学习技术。

这对未来情绪感知工具意味着什么

简言之,研究表明,当计算机读取多种身体和大脑信号并通过清晰、类规则的知识先行解释后再应用深度学习,就能以令人印象深刻的可靠性评估人类的恐惧等级。这种混合设计兼具两方面优势:现代神经网络的强大能力与专家可检查和改进的逻辑规则的透明性。该方法可为未来的心理健康监测、自适应娱乐和安全系统提供基础,使它们不仅能推测我们的情绪,还能解释为什么认为我们感到害怕,从而为更值得信赖和更个性化的技术打开可能性。

引用: Joshva, A.A., Balasubramanian, V.K. & Murugappan, M. A logic-based knowledge-driven bidirectional multi-attention GRU framework for fear level classification in humans. Sci Rep 16, 13722 (2026). https://doi.org/10.1038/s41598-026-44151-x

关键词: 情绪识别, 恐惧检测, 生理信号, 深度学习, 可解释人工智能