Clear Sky Science · ru

SuryaBench: эталонный набор данных для развития машинного обучения в гелиофизике и прогнозировании космической погоды

· Назад к списку

Почему поток данных от Солнца имеет значение

Наш технологически насыщенный мир тихо зависит от настроений Солнца. Солнечные бури могут нарушать работу GPS, радиосвязи и даже электросетей. Зонд SDO (Solar Dynamics Observatory) НАСА наблюдает за Солнцем с высокой детализацией уже более десяти лет, но огромный объём и сложность этих изображений затрудняют их широкое использование. В этой статье представлен SuryaBench — тщательно подготовленный набор солнечных данных, созданный так, чтобы современные инструменты искусственного интеллекта могли «читать» Солнце и помогать нам более надёжно прогнозировать космическую погоду.

Более ясная картина нашей активной звезды

SuryaBench начинается с потока необработанных снимков и измерений, которые SDO собирает с 2010 года. Один инструмент регистрирует излучение очень горячего солнечного газа высоко над поверхностью, другой картирует магнитные поля и движение на самой поверхности. Авторы выравнивают, очищают и стандартизируют эти изображения так, чтобы диск Солнца всегда располагался в одном и том же месте, имел одинаковый размер и резкость, а изменения орбиты аппарата или старение камер были скорректированы. В результате получается единое представление Солнца в исходном разрешении, повторяемое каждые 12 минут на протяжении почти всего 11‑летнего солнечного цикла.

Figure 1. Как детальные наблюдения Солнца питают ИИ‑системы, которые помогают защищать спутники, электросети и средства связи на Земле.
Figure 1. Как детальные наблюдения Солнца питают ИИ‑системы, которые помогают защищать спутники, электросети и средства связи на Земле.

От беспорядочных измерений к данным, готовым для машин

Преобразование этого сырого хранилища в материал, на котором могут учиться компьютеры, требует множества аккуратных шагов. Команда корректирует вращение и наведённость космического аппарата, учитывает разные времена экспозиции, чтобы яркие и тусклые структуры обрабатывались справедливо, и компенсирует постепенное изнашивание детекторов. Они также объединяют кадры с разных инструментов так, чтобы структуры, видимые в свечение горячего газа, точно совпадали с магнитными узорами, которые их формируют. Кроме того, они исправляют кажущийся размер солнечного диска, который в противном случае менялся бы с изменением расстояния аппарата до Солнца. Эти решения устраняют помехи, которые могли бы сбивать с толку алгоритмы обучения, и позволяют им сосредоточиться на реальном поведении Солнца.

Встроенные испытания для продвинутых моделей

Вместо простого набора очищенных изображений SuryaBench также включает шесть готовых «челлендж‑наборов», отражающих ключевые вопросы в исследованиях Солнца и космической погоды. Один набор сфокусирован на выявлении магнитно‑активных участков на поверхности Солнца, другой — на обнаружении тонких признаков готовящегося появления такой области, а третий — на связи поверхностной магнитной активности с петлеобразными магнитными полями в короне. Другие связывают солнечные изображения с событиями, важными для Земли: всплесками рентгеновского излучения (солнечными вспышками), изменениями скорости солнечного ветра у Земли и вариациями экстремального ультрафиолетового излучения Солнца, влияющими на верхнюю атмосферу и сопротивление спутников. Для каждой задачи заданы стандартные разбиения данных и примерные модели машинного обучения, чтобы исследователи могли сравнивать методы на равных условиях.

Figure 2. Как очищенные и выровненные солнечные изображения последовательно поступают в задачи ИИ для прогнозирования вспышек, солнечного ветра и магнитной активности.
Figure 2. Как очищенные и выровненные солнечные изображения последовательно поступают в задачи ИИ для прогнозирования вспышек, солнечного ветра и магнитной активности.

Тестирование современных инструментов на грядущих бурях

Чтобы показать применение SuryaBench, авторы прогоняют ряд популярных глубоких нейросетей по нескольким задачам. Они демонстрируют, что современная нейросеть уже способна с хорошей точностью предсказывать будущие солнечные изображения и решать задачи вроде сегментации активных областей, оценки скорости солнечного ветра и классификации сильных вспышек. Результаты различаются в зависимости от задачи и семейства моделей, что подчёркивает как потенциал подходов, основанных на данных, так и необходимость дальнейших инноваций. Публикуя общие метрики точности и открывая код, проект задаёт ясную отправную точку для будущей работы.

Что это значит для жизни на Земле

Практически SuryaBench — это не столько попытка создать единый идеальный прогноз сегодня, сколько предоставление сообществу общего, высококачественного полигона для создания лучших прогнозов завтра. Упаковывая годы тщательно очищенных наблюдений Солнца вместе с чётко определёнными задачами прогнозирования, набор данных снижает барьер для сотрудничества как гелиофизиков, так и специалистов по машинному обучению. По мере улучшения моделей можно ожидать более стабильных рекомендаций о том, когда Солнце может нарушить работу наших космических и наземных систем. Для широкой публики эта инициатива приближает космическую погоду к обычной погоде — к тому, что мы можем отслеживать, предсказывать и планировать с растущей уверенностью.

Цитирование: Roy, S., Hegde, D.V., Schmude, J. et al. SuryaBench: Benchmark Dataset for Advancing Machine Learning in Heliophysics and Space Weather Prediction. Sci Data 13, 712 (2026). https://doi.org/10.1038/s41597-026-06552-5

Ключевые слова: космическая погода, солнечные вспышки, гелиофизика, машинное обучение, солнечный ветер