Clear Sky Science · zh
SuryaBench:促进日球物理与空间天气预测的基准数据集
为什么来自太阳的数据洪流很重要
我们的技术世界在不声不响中依赖太阳的“情绪”。太阳风暴会干扰 GPS、无线电链路,甚至电力网。美国宇航局的太阳动力学观测台(SDO)十多年来以极高的细节观测太阳,但这些图像的数量和复杂性使其难以被广泛利用。本文介绍了 SuryaBench——一个经过精心处理的太阳观测数据集合,使现代人工智能工具能够学习“读懂”太阳,并帮助我们更可靠地预报空间天气。
更清晰的恒星图像
SuryaBench 的起点是自 2010 年以来由 NASA 的太阳动力学观测台捕获的原始图像与测量数据流。一个仪器记录来自太阳表面上方极热等离子体发出的光,另一个则绘制表面磁场与运动。作者对这些图像进行对齐、清理与标准化,使太阳光盘始终出现在相同位置、具有相同大小与清晰度,并修正航天器轨道变化或相机老化带来的影响。结果是一个统一的太阳视图,保持原始分辨率,每 12 分钟一次,覆盖近乎完整的 11 年太阳活动周期。 
从杂乱测量到机器可用的数据
将这片原始宝库转化为计算机可学习的素材需要许多细致步骤。团队校正了航天器的自转与指向,调整不同曝光时间以公平对待明亮与昏暗特征,并补偿探测器的逐步磨损。他们还将来自不同仪器的图像合并,使高温发光等离子体中的结构能与塑造这些结构的磁场模式精确对齐。此外,他们修正了太阳光盘的表观大小,这一尺寸会随航天器与太阳距离的变化而改变。这些处理消除了会混淆学习算法的干扰,使其能专注于真实的太阳行为。
为智能模型内置的挑战
SuryaBench 不仅提供清理后的图像,还包含六个现成的“挑战集”,覆盖太阳与空间天气研究的关键问题。其一关注识别太阳表面的磁活跃斑块,另一项着眼于发现此类区域即将出现的微弱前兆,第三项将表面磁场与日冕中环状磁场连接起来。其他任务将太阳图像与地球附近重要事件关联,例如被称为太阳耀斑的 X 射线爆发、掠过地球的太阳风阵风变化,以及影响高层大气与卫星阻力的极紫外辐射波动。每个任务都提供标准数据划分与示例机器学习模型,便于研究者在同一基准上比较方法。 
在明天的风暴上测试今天的工具
为展示 SuryaBench 的用途,作者在若干任务上运行了多种流行的深度学习模型。他们演示了现代神经网络已经能以良好保真度预测未来的太阳图像,并能处理诸如分割活跃区、估计太阳风速度和分类强耀斑等问题。不同任务与模型家族的表现各不相同,这既凸显了数据驱动方法的潜力,也显示出需要进一步创新。通过报告通用的准确度指标并共享代码,该项目为今后的工作设定了明确的参考线。
这对地球生活的意义
从实用角度看,SuryaBench 的意义不在于今天就构建出单一完美的预报,而在于为社区提供一个共享的高质量试验场,以便明天构建更好的预报。通过将多年的精细清理的太阳观测与定义明确的预测问题打包在一起,该数据集降低了太阳物理学家与机器学习专家协作的门槛。随着模型的改进,我们可以期待在太阳何时可能干扰我们空间与地面系统方面获得更稳健的指引。对公众而言,这一努力使得将空间天气逐步视为类似常规天气——可以追踪、预期并有计划应对——的目标更接近现实。
引用: Roy, S., Hegde, D.V., Schmude, J. et al. SuryaBench: Benchmark Dataset for Advancing Machine Learning in Heliophysics and Space Weather Prediction. Sci Data 13, 712 (2026). https://doi.org/10.1038/s41597-026-06552-5
关键词: 空间天气, 太阳耀斑, 日球物理, 机器学习, 太阳风