solarhub-magnetogram
收藏Hugging Face2026-03-11 更新2026-03-12 收录
下载链接:
https://huggingface.co/datasets/SpaceGen/solarhub-magnetogram
下载链接
链接失效反馈官方服务:
资源简介:
SolarHub磁图标注数据集是一个用于太阳观测分类的公民科学项目SolarHub中的磁图任务用户标注数据集。数据集包含2872个样本,每个样本包含以下字段:太阳观测图像的HTTPS URL(url)、固定为'magnetogram'的任务类型(task_type)、人工标注标签(user_label)以及包含标注者、问题编号和时间戳的元数据(metadata)。标注数据通过GitHub Issues收集,并由Aurora管道每晚合并。该数据集适用于图像分类任务,特别是太阳磁图分类。数据集大小为399208字节,下载大小为136431字节。相关训练模型已发布在SpaceGen/solarhub-model-magnetogram。
创建时间:
2026-03-08
搜集汇总
数据集介绍

构建方式
在太阳物理学领域,对太阳磁图进行精确分类是理解太阳活动的基础。SolarHub-Magnetogram数据集的构建依托于公民科学项目SolarHub,通过GitHub Issues平台系统性地收集志愿者对太阳观测图像的标注。每日夜间,Aurora数据流水线自动整合这些标注,形成结构化的数据集,确保了数据来源的广泛性和时效性。
特点
该数据集聚焦于太阳磁图分类任务,每条记录包含观测图像的URL、固定的任务类型以及用户标注的标签。其元数据字段详细记录了标注者信息、问题编号及时间戳,为研究太阳磁活动提供了可追溯的标注来源。数据集规模适中,涵盖2872个样本,适用于图像分类模型的训练与验证。
使用方法
研究人员可利用该数据集开发或优化太阳磁图自动分类模型。通过访问图像URL获取原始观测数据,结合用户标注标签作为监督信号,可训练机器学习算法识别太阳磁图特征。数据集已与预训练模型SpaceGen/solarhub-model-magnetogram关联,支持端到端的太阳物理研究流程。
背景与挑战
背景概述
太阳物理学领域长期致力于通过太阳磁图观测来理解太阳磁场活动及其对空间天气的影响。SolarHub-Magnetogram数据集由SpaceGen机构于近年创建,作为SolarHub公民科学项目的一部分,旨在汇集公众对太阳磁图图像的标注数据,以支持太阳活动分类研究。该数据集的核心研究问题聚焦于利用众包标注提升太阳磁图自动分类模型的性能,从而促进太阳物理观测数据的智能化分析,对空间天气预测和太阳物理学研究具有重要的辅助价值。
当前挑战
在太阳磁图分类领域,主要挑战在于太阳磁场结构的复杂性和动态变化性,使得准确识别磁图特征并区分不同活动类型(如太阳黑子、耀斑前兆)变得困难。数据构建过程中,面临标注质量控制的挑战,因为公民科学项目依赖非专业志愿者的参与,可能导致标注不一致或噪声引入;同时,数据集成来自GitHub Issues的分布式标注流程,需确保标注数据的完整性与时效性,这对数据清洗和标准化提出了较高要求。
常用场景
经典使用场景
在太阳物理学领域,太阳磁图是研究太阳磁场活动的基础观测资料。SolarHub-Magnetogram数据集通过众包标注方式,汇集了大量太阳磁图图像的人工分类标签,为机器学习模型提供了高质量的监督学习样本。该数据集最经典的使用场景是训练和评估太阳磁图自动分类模型,帮助天文学家高效识别太阳磁场结构,如太阳黑子、磁通量区等特征,从而支持太阳活动监测与预报研究。
解决学术问题
太阳磁场活动的复杂性使得传统人工分析耗时且易受主观影响。SolarHub-Magnetogram数据集通过标准化众包标注,解决了太阳磁图分类中标签稀缺、一致性不足的学术难题。它促进了太阳物理领域的数据驱动研究,为开发自动化分析工具提供了基准,显著提升了太阳磁场演化、太阳耀斑触发机制等关键科学问题的研究效率,推动了计算天体物理学与公民科学的交叉融合。
衍生相关工作
围绕SolarHub-Magnetogram数据集,衍生了一系列经典研究工作。例如,SpaceGen团队基于该数据训练了公开的预训练模型solarhub-model-magnetogram,为社区提供了即用的分类工具。此外,该数据集还激发了多模态太阳数据分析、半监督学习在太阳物理中的应用等探索,推动了如SolarNet、HelioML等开源项目的进展,丰富了太阳物理学与人工智能结合的学术生态。
以上内容由遇见数据集搜集并总结生成



