Clear Sky Science · zh

探索深度学习如何通过 Grad-CAM 解读反常扩散

· 返回目录

用智能工具观察游走的粒子

从细胞中忙碌的分子到股价的波动,许多自然现象的运动方式并不遵循简单扩散的整齐可预测规律。科学家知道,不同的潜在机制会产生这些不寻常的轨迹,但仅从一段短且带噪声的轨迹判断哪种机制在起作用非常困难。本研究展示了现代人工智能如何不仅将这些游走轨迹分类,还能揭示其决策中哪些轨迹片段最为关键。

四处可见的异常运动

教科书中常把随机运动描绘成醉汉漫步,位置的平均扩散随时间稳步增长。然而现实中的运动很少如此规整。在活细胞、社会系统和金融市场中,位置的扩散速率可能比预期更快或更慢,这种行为被称为反常扩散。物理学家提出了许多数学模型来解释这种现象,从包含长等待时间的游走到具有长期记忆的路径。然而当他们仅观察单条记录的轨迹时,这些模型往往难以区分,尤其是在可用时间窗口较短且数据含噪时。

教神经网络读懂轨迹

基于最近在反常扩散(AnDi)挑战赛中的工作,作者设计了一个名为 ResAnDi 的深度学习工具用于分类运动轨迹。ResAnDi 建立在一种流行的图像识别架构——残差网络(residual network)之上,经过改造以处理二维位置的时间序列而不是彩色像素。它在来自八种不同运动机制的模拟轨迹上训练,包括标准布朗运动以及若干次扩散和超扩散变体。轨迹经过 18 层堆叠的处理层后,网络输出该轨迹来自各机制的概率,其准确率可与 AnDi 挑战赛的顶级参赛作品相媲美,尽管它需要区分更多的类别。

照亮关键时刻
Figure 1. 人工智能如何阅读游走的粒子轨迹以区分不同类型的异常运动
Figure 1. 人工智能如何阅读游走的粒子轨迹以区分不同类型的异常运动

深度学习系统常被批评为“黑箱”,因为它们可能给出正确答案却不展示其推理过程。为了解开这个黑箱,作者应用了一种可解释人工智能技术——Grad-CAM,该方法为输入的不同部分分配“相关性得分”。在这里的改编中,Grad-CAM 高亮显示那些对 ResAnDi 最终判断影响最大的轨迹片段。团队通过选择性抹除轨迹的部分区域来检验这些得分是否反映真实信息:当他们平滑(去除波动)具有最高 Grad-CAM 得分的片段时,分类准确率的下降远大于抹除同等长度随机片段时的下降。这表明网络学会依赖特定的、信息量大的运动片段,这些片段通常对应罕见但富有指示性的波动。

用解释来对抗噪声并发现模式
Figure 2. 人工智能热图如何突出嘈杂粒子轨迹中最具信息量的片段
Figure 2. 人工智能热图如何突出嘈杂粒子轨迹中最具信息量的片段

Grad-CAM 得分还提示了一种更聪明的数据扩充方法。作者没有随机增强轨迹,而是选取那些片段倾向于具有高相关性得分的轨迹,对它们进行旋转并将其加入训练池。当他们随后在带噪轨迹上测试网络时,这种有针对性的增强相比标准随机增强使分类器在噪声较强时始终更稳健。为了理解网络真正学到了什么,团队研究了其内部层并将 Grad-CAM 得分与运动的简单统计量联系起来,例如连续步长间的相关性、方向变化程度、步长分布偏离正态的强度,以及随时间变化的有效“扩散速率”。不同机制在这些统计量与高 Grad-CAM 得分的对齐方式上显示出不同的指纹。

窥见 AI 的推理过程

通过结合性能测试、可视化和细致的统计检验,该研究勾勒出深度网络如何解码复杂运动的连贯图景。早期层关注非常局部的特征,比如步长是倾向反转还是延续,而更深的层捕捉更慢的趋势,例如粒子活动范围随时间的逐渐变化。Grad-CAM 在这些隐藏计算和人类直觉之间搭起桥梁,指示出哪些轨迹片段和哪类模式最具信息量。对非专家而言,主要结论是:人工智能不仅可以被训练以高精度标注复杂的粒子运动,还能指示出支持其判断的具体数据部分,为物理学、生物学及其他领域对复杂运动进行更透明、更抗噪的分析铺平道路。

引用: Bae, J., Baek, Y. & Jeong, H. Exploring how deep learning decodes anomalous diffusion via Grad-CAM. Nat Commun 17, 4575 (2026). https://doi.org/10.1038/s41467-026-71229-x

关键词: 反常扩散, 深度学习, Grad-CAM, 粒子轨迹, 可解释人工智能