Clear Sky Science · zh

基于稳定方法的对角递归量子神经网络用于非线性系统识别

· 返回目录

教会机器理解混乱系统

塑造我们生活的许多系统——从家电中的电动机到湍流气流,甚至某些医疗过程——表现出复杂的非线性行为。这意味着对输入的微小变化可能会产生出人意料的大幅或混沌响应。预测和控制此类系统既困难又至关重要,因为它关系到效率、安全性和节能。本文提出了一种结合量子计算、神经网络与稳定性理论的新型学习机器,以更准确、更可靠地建模这些棘手行为。

Figure 1
Figure 1.

为何普通模型不够

传统建模工具通常假设因果和响应是整齐且成比例的,这对简单或近似线性的系统有效。但许多真实系统具有记忆、反馈和阈值,使得其行为高度非线性。经典神经网络有所帮助,但也有自身问题。前馈网络(信息单向传递)擅长静态任务,但在历史信号重要时表现不佳。递归网络通过将信息回环以产生记忆,可以捕捉随时间变化的行为,但常常难以训练、易失稳,而且当每个神经元彼此相连时计算开销很大。

将量子思想与简化回路融合

作者提出了一种具有李雅普诺夫稳定性的对角递归量子神经网络,简称 DRQNN-LS。其核心仍然像熟悉的三层神经网络:输入、隐层和输出。但两个改进使其与众不同。首先,隐单元表现得像简化的量子比特,其内部状态用类相位量描述,而非普通数值。这种受量子启发的表示让每个单元能以紧凑方式编码更丰富的信息,从而提升网络逼近复杂关系的能力。其次,取代复杂的互联反馈,每个隐层神经元仅向自身反馈。这种“对角”递归保留了跟踪时变模式所需的记忆,同时大幅减少需要调优的连接数量。

Figure 2
Figure 2.

让学习保持稳定并受控

训练任何递归网络的主要挑战是保持学习稳定:若权重变化过于激进,模型输出可能爆炸或振荡;若变化过慢,训练将漫长且可能陷入停滞。这里作者依赖李雅普诺夫稳定性理论——一种最初用于分析物理系统安全性的数学框架。他们构造了一个将建模误差与网络参数规模结合起来的特殊类能量函数。通过精确推导该函数随时间的变化,他们得到用于更新网络权重和内部参数的自动规则,使整体“能量”只能减小。这产生了能自行加速或放慢的自适应学习率,保证收敛而无需手动调参。

将新网络付诸测试

为证明 DRQNN-LS 不仅是纸上的好构想,作者在三项截然不同的任务上进行了测试。首先,他们对一个已知行为的数学非线性系统建模,检验网络追踪输出的精度。其次,他们处理混沌的亨农映射,这是一个经典基准:初值的微小差异会产生截然不同的轨迹。第三,他们将该方法应用于来自小型直流电机的真实数据——这是一个有噪声且实际的设备,其内部机理并不完全已知。在每种情况下,作者都将新方法与若干现有神经模型进行了比较,包括经典的对角递归网络和早期用更简单梯度规则训练的量子启发版本。

更高的准确性、鲁棒性与噪声容忍度

在所有三个示例中,DRQNN-LS 均表现出较低的预测误差和更符合真实信号的拟合效果,即便在故意加入大量噪声的数据情况下亦然。虽然新模型在每步计算上需要稍多的开销——因为它需要跟踪递归的量子启发状态并评估基于李雅普诺夫的更新——但在现代处理器上运行时间仍足够小,可满足实时使用。结果表明,将精简的递归结构、类量子神经元状态与数学上有保证的稳定学习相结合,能为理解和预测现实世界中非线性动力学提供一套强大且实用的工具。

展望未来的意义

对非专业读者而言,结论是我们正在学会如何构建更智能、更可信的“混乱”物理系统数字孪生。DRQNN-LS 提供了一种从数据直接学习复杂过程行为的方式,同时确保其学习不会“爆炸”或不可预测地偏移。这种灵活性与稳定性的结合,在工业控制、机器人、电力系统,乃至生物或医疗建模等领域都可能具有重要价值,因为这些领域常常面临非线性行为与嘈杂测量。

引用: Khalil, H., Elshazly, O. & Shaheen, O. Stable approach based diagonal recurrent quantum neural networks for identification of nonlinear systems. Sci Rep 16, 8274 (2026). https://doi.org/10.1038/s41598-026-37973-2

关键词: 非线性系统识别, 量子神经网络, 递归神经网络, 李雅普诺夫稳定性, 混沌动力学建模