Clear Sky Science · zh
在物理启发的时空符号回归中从表格转向图
教计算机发现自然的隐藏规则
大量科学工作归结为寻找能解释世界随时间如何变化的简单规则——从摆的摆动到热量在金属棒中的扩散。本文探讨了一种新的方法,帮助计算机直接从数据中重新发现这些规则,不仅关注数值本身,还关注这些数值的测量位置与时间。研究显示,将两种数据视角(传统的电子表格视图与网络视图)结合起来,可以使方程的自动发现更准确、对噪声更鲁棒,并且更贴近真实物理。
从数字电子表格到连接网络
目前大多数自动方程发现工具将数据视为普通表格,其中每一行是独立的测量值。这样的设置适用于简单问题,但在处理同时在空间和时间上演化的真实物理系统时会遇到困难。某一点的温度读数取决于其邻域以及之前时刻发生的情况。忽视这些关联可能导致计算机给出虽然拟合数据但偏离真实规律的公式。作者主张,为了尊重自然的工作方式,我们需要一种能够记录哪些测量在空间和时间上彼此为邻的表示,而不仅仅是其原始数值。

将测量转为时空网络
为了解决这一问题,研究提出了一种双重数据表示。第一种视角是熟悉的数字表格。第二种视角是图——一个网络,其节点对应于在特定位置和时间采集的测量值,边则将空间或时间上相近的读数连接起来。该图作为局部因果关系的地图:沿空间边的差异反映空间变化,沿时间边的差异模拟随时间的变化率。基于图的神经网络随后处理该结构,学习出压缩的、具备物理感知的特征,这些特征强调平滑、一致的模式并削弱随机噪声的影响。
教会方程搜索器听从物理约束
一旦得到这些学习到的特征,它们就被输入到符号回归工具中,后者搜索描述数据的人类可读方程。关键创新是一个新的训练目标,对候选方程进行双重评判。首先,它检查来自候选方程的模拟数据与原始测量数据的拟合程度。其次,它检查经过图神经网络处理后的模拟数据是否落在与真实数据相同的“潜在”空间。第二项检查迫使发现的方程尊重由图捕捉到的时空关系,从而把搜索从那些虽然拟合数值但破坏已知物理结构的公式中引导出来。

将方法付诸考验
为评估该想法的效果,作者从十个经典的物理与工程方程生成了合成数据,涵盖弹簧定律、热传导、类流体运动以及具有延迟响应的系统等。对于每一种情况,他们加入了额外的干扰信号并控制噪声水平,然后在有无新图表示的情况下运行十种不同的方程搜索方法。总体而言,使用双重视角带来了适度但一致的精度提升、更好的符号形式恢复以及更接近物理约束的结果。当数据嘈杂或稀缺时(这类情况在真实实验中常见),这些好处尤为显著。
这对未来科学发现的意义
简而言之,文章表明,给予计算机不仅是数值,还有这些数值在空间和时间上彼此关联的示意,可以帮助它们更可靠地猜出正确的方程。将网络视角织入原本的方程发现工具之中,能在不改变这些工具内部机制的情况下提高鲁棒性。尽管这里的测试使用了精心控制的模拟数据,该方法为从有限测量中获得更可信、与物理一致的模型提供了一条实用路径,使自动化方程发现离在实验室和工程实践中的日常应用更进一步。
引用: Lazebnik, T., Liberzon, A. Moving from table to graph in physics-informed spatio-temporal symbolic regression. Sci Rep 16, 16016 (2026). https://doi.org/10.1038/s41598-026-53882-w
关键词: 符号回归, 图神经网络, 时空数据, 方程发现, 物理约束学习