SuryaBench
收藏github2025-05-21 更新2025-05-22 收录
下载链接:
https://github.com/NASA-IMPACT/SuryaBench
下载链接
链接失效反馈官方服务:
资源简介:
SuryaBench是一个标准化的测试基准,用于评估基础AI模型在太阳物理学和空间天气科学中各种任务的性能。它包含与六个关键任务相关的应用数据集,这些任务涉及太阳和太阳圈事件生态系统的各个方面。
SuryaBench is a standardized test benchmark designed to evaluate the performance of foundational AI models across various tasks in the fields of solar physics and space weather science. It comprises application datasets associated with six key tasks, which cover various aspects of the solar and heliospheric event ecosystem.
创建时间:
2025-05-13
原始信息汇总
SuryaBench数据集概述
数据集简介
SuryaBench是一个标准化的测试基准,用于评估基础AI模型在太阳物理学和空间天气科学中各种任务的表现。数据集包含六个关键任务的应用程序数据集,涵盖预测、分割和重建等任务。
数据集获取
完整数据集及输入文件和应用程序特定实例可通过Hugging Face平台获取:
应用程序数据集详情
1. 活动区域分割
- 包含带有磁极性反转线(ARPILs)的活动区域分割图。
- 数据生成应用于太阳磁场的视线分量。
- 使用C++处理磁图数据,依赖OpenCV、CUDA、CFITS10和HDF5等库。
2. 活动区域出现预测
- 包含50个活动区域出现实例。
- 实例出现在太阳表面中央子午线30度范围内。
- 持续超过四天,包含日震和磁信息(磁通量、多普勒速度和连续强度)。
3. 日冕场外推
- 评估AI基础模型模拟基于物理的ADAPT-WSA PFSS模型的有效性。
- 预测参数为球谐系数,代表光球层和源表面(2.51 Rs)之间的磁势。
4. 太阳耀斑预测
- 生成标记的太阳耀斑时间序列数据。
- 使用滚动窗口方法,输出包括基于最大耀斑等级和给定时间窗口内累积耀斑强度的二进制标签。
5. 太阳风预测
- 包含太阳风预测标签的生成代码。
- 提供从OMNI下载太阳风数据的脚本和数据分割。
6. 太阳EUV光谱建模
- 包含从SDO/EVE(MEGS-A)生成高能EUV光谱的代码,时间分辨率为10秒。
- EUV光谱在控制地球高层大气的热力学状态中起重要作用。
引用
bibtex @misc{suryabench, title={SuryaBench: Benchmark Dataset for Advancing Machine Learning in Heliophysics and Space Weather Prediction}, author={ Sujit Roy and Dinesha Vasanta Hegde and Johannes Schmude and Amy Lin and Vishal Gaur and Talwinder Singh and Rohit Lal and Andrés Muñoz-Jaramillo and Kang Yang and Chetraj Pandey and Jinsu Hong and Berkay Aydin and Ryan McGranaghan and Spiridon Kasapis and Vishal Upendran and Shah Bahauddin and Daniel da Silva and Marcus Freitag and Nikolai Pogorelov and Manil Maskey and Rahul Ramachandran}, year={2025} }
数据集作者
- Sujit Roy
- Dinesha Vasanta Hegde
- Johannes Schmude
- Amy Lin
- Vishal Gaur
- Talwinder Singh
- Rohit Lal
- Andrés Muñoz-Jaramillo
- Kang Yang
- Chetraj Pandey
- Jinsu Hong
- Berkay Aydin
- Ryan McGranaghan
- Spiridon Kasapis
- Vishal Upendran
- Shah Bahauddin
- Daniel da Silva
- Marcus Freitag
- Nikolai Pogorelov
- Manil Maskey
- Rahul Ramachandran
应用程序数据集联系人
- 活动区域分割: Jinsu Hong
- 活动区域出现预测: Spyros Kasapis
- 日冕场外推: Daniel da Silva
- 太阳耀斑预测: Jinsu Hong
- 太阳风预测: Vishal Upendran
- 太阳EUV光谱建模: Shah Bahauddin
搜集汇总
数据集介绍

构建方式
SuryaBench数据集作为太阳物理学与空间天气科学领域的标准化测试基准,其构建过程体现了多学科交叉的严谨性。研究团队通过整合太阳动力学观测站(SDO)、欧米尼(OMNI)等多源空间探测数据,采用物理模型驱动与数据驱动相结合的方法构建六大核心任务数据集。针对活动区分割任务,基于OpenCV和CUDA实现了高效磁图处理流程;在日冕场外推任务中,采用球谐系数表征光球层至源表面之间的磁势场分布;太阳风预报数据则通过精心设计的滑动窗口方法生成时间序列标签。每个子数据集均经过领域专家验证,确保其科学有效性。
特点
该数据集最显著的特点是覆盖太阳活动多尺度物理过程的完整价值链,包含从光球层活动区识别到日冕磁场重构,再到行星际空间太阳风预报的全链条研究要素。数据集时空分辨率具有差异化特征,如极紫外光谱数据达到10秒高时间分辨率,而活动区 emergence 预测则包含持续四天以上的连续观测。所有数据均采用标准化预处理,并保留原始物理单位,既适合机器学习模型训练,又可直接用于物理分析。特别值得注意的是,数据集通过六种不同类型的任务设计,全面检验模型在分类、回归、分割等不同机器学习范式下的表现。
使用方法
研究者可通过Hugging Face平台获取数据集的完整架构,每个子任务目录包含数据加载脚本、预处理代码和基准评估指标。使用流程建议从config文件入手,明确各任务输入输出张量维度及物理含义。对于活动区分割等计算密集型任务,推荐配置CUDA环境以加速处理;太阳风预测等时间序列任务则需注意保持训练验证测试集的时间连续性。数据集提供与PyTorch和TensorFlow兼容的数据加载器,用户可通过修改application-specific参数适配不同模型架构。评估时应当注意,部分任务如日冕场外推需要同时考虑物理约束条件和传统机器学习指标。
背景与挑战
背景概述
SuryaBench是由NASA IMPACT团队主导开发的一个标准化测试基准,旨在评估基础AI模型在太阳物理学和空间天气科学领域的多任务性能。该数据集于2025年正式发布,汇集了太阳活动区域分割、日冕磁场外推、太阳耀斑预测等六大核心任务,为研究太阳磁活动与空间天气的关联机制提供了关键数据支持。作为首个面向日球层物理的综合性基准,其创新性地将传统物理模型与机器学习方法相结合,显著推动了空间环境预测模型的迭代升级。
当前挑战
在领域问题层面,太阳活动具有高度非线性和混沌特性,传统物理模型难以准确预测太阳耀斑爆发时机与强度,而机器学习方法面临小样本、数据噪声等难题。构建过程中,研究团队需解决多源异构数据的时空对齐问题,包括协调SDO卫星不同仪器的观测频段差异,以及处理日冕磁场外推任务中球谐系数的维度灾难。此外,太阳风预测任务要求精确建模日地空间等离子体环境,其跨尺度物理过程的耦合机制对数据采样策略提出了严峻考验。
常用场景
经典使用场景
在太阳物理学和空间天气科学领域,SuryaBench数据集为评估基础AI模型在多种任务中的性能提供了标准化测试基准。该数据集涵盖了六个关键任务,包括活动区域分割、活动区域出现预测、日冕场外推、太阳耀斑预报、太阳风预报和太阳极紫外光谱建模。这些任务广泛应用于太阳和太阳圈事件生态系统的研究中,为研究人员提供了一个全面且标准化的评估平台。
解决学术问题
SuryaBench数据集解决了太阳物理学和空间天气科学中的多个关键学术问题。例如,通过活动区域分割任务,研究者可以更准确地识别和分析太阳表面的磁场结构;太阳耀斑预报任务则有助于预测可能对地球空间环境产生重大影响的太阳活动。这些任务的标准化数据集为相关领域的模型开发和性能评估提供了可靠的基础,推动了该领域的学术进展。
衍生相关工作
SuryaBench数据集的发布催生了一系列相关研究。例如,基于该数据集的活动区域分割任务,研究者开发了多种深度学习模型,显著提高了太阳磁场结构的识别精度。在太阳耀斑预报任务中,该数据集被用于训练和评估多种时间序列预测模型,进一步推动了太阳活动预测技术的发展。这些衍生工作不仅验证了数据集的实用性,也为相关领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



