five

solarhub-prominence

收藏
Hugging Face2026-03-11 更新2026-03-12 收录
下载链接:
https://huggingface.co/datasets/SpaceGen/solarhub-prominence
下载链接
链接失效反馈
官方服务:
资源简介:
SolarHub Prominence Annotations 数据集是 SolarHub 公民科学太阳观测分类项目中用于突出物(Prominence)任务的用户标注数据集。该数据集包含太阳观测图像的 HTTPS URL、任务类型(固定为 'prominence')、人工标注标签以及包含标注者、问题编号和时间戳的元数据。标注通过 GitHub Issues 收集,并由 Aurora 管道每晚合并。数据集包含 55,172 个样本,适用于图像分类任务。对应的训练模型已发布在 SpaceGen/solarhub-model-prominence。
创建时间:
2026-03-08
搜集汇总
数据集介绍
main_image_url
构建方式
在太阳物理学研究领域,太阳活动现象的标注数据对于模型训练至关重要。SolarHub-Prominence数据集通过公民科学项目SolarHub构建,利用GitHub Issues平台收集志愿者对太阳观测图像中‘日珥’现象的标注。标注流程由Aurora管道每夜自动整合,确保了数据的持续更新与一致性,最终形成包含五万余条标注记录的结构化数据集。
特点
该数据集专注于太阳日珥的图像分类任务,每一条数据均包含观测图像的URL链接、固定的任务类型标识以及由志愿者提供的人工标注标签。元数据部分详细记录了标注者信息、问题编号及时间戳,支持追溯标注来源。数据集采用CC-BY-4.0许可,强调开放共享,并附带针对日珥现象训练的预训练模型,为太阳物理研究提供了可直接应用的标注资源。
使用方法
研究人员可将该数据集直接用于太阳活动图像的分类模型训练或验证。通过解析URL字段获取原始观测图像,结合user_label字段作为监督信号,能够构建或微调日珥检测模型。数据集的结构化元数据支持标注质量分析或偏差研究,而预训练模型的配套发布进一步简化了下游任务的部署流程,助力太阳物理学中的自动化观测分析。
背景与挑战
背景概述
SolarHub-Prominence数据集是太阳物理学与公民科学交叉领域的一项创新成果,由SpaceGen机构主导构建,旨在通过众包方式系统性地标注太阳日珥观测图像。该数据集依托SolarHub平台,利用GitHub Issues机制收集全球志愿者对太阳观测图像的标注,自创建以来已积累超过五万条标注记录,为核心研究问题——太阳活动中的日珥自动识别与分类——提供了大规模、多样化的训练数据。其出现显著推动了太阳物理学中计算机视觉方法的应用,使得传统依赖专业天文学家人工识别的模式得以向自动化、高吞吐量分析转型,为太阳活动监测与空间天气预报研究注入了新的活力。
当前挑战
在太阳物理学领域,日珥的自动识别长期面临形态多变、尺度差异显著以及与太阳表面其他结构混淆等核心挑战,SolarHub-Prominence数据集正是为应对这些难题而生。数据构建过程中,如何确保非专业志愿者标注的准确性与一致性成为关键瓶颈,需通过严谨的流程设计与质量控制机制来平衡众包效率与数据可靠性。此外,太阳观测图像受仪器差异、观测条件及噪声干扰较大,使得数据预处理与特征标准化工作异常复杂,这些因素共同构成了数据集在推动日珥智能识别研究中所必须克服的实质性障碍。
常用场景
经典使用场景
在太阳物理学领域,SolarHub-Prominence数据集为日珥识别任务提供了宝贵的标注资源。该数据集通过众包方式收集了太阳观测图像中关于日珥存在与否的人工标注,常用于训练和评估机器学习模型,特别是图像分类算法。研究人员利用这些标注数据开发自动化工具,以辅助天文学家从海量太阳图像中快速识别日珥结构,从而减少人工筛查的工作量,提升太阳活动监测的效率。
解决学术问题
该数据集有效解决了太阳物理学中大规模日珥自动检测的难题。传统方法依赖专家手动标注,耗时且难以扩展,而SolarHub-Prominence通过众包标注构建了高质量的训练样本,支持监督学习模型的开发。这促进了日珥识别算法的进步,有助于深入理解日珥的形成机制及其与太阳活动周期的关联,为空间天气预测和太阳物理研究提供了数据基础。
衍生相关工作
围绕SolarHub-Prominence数据集,衍生了一系列经典研究工作。例如,SpaceGen团队基于该数据训练了公开的日珥识别模型,推动了开源太阳物理工具的发展。此外,许多研究利用该数据集探索了迁移学习、弱监督方法在太阳图像分析中的应用,进一步优化了日珥检测的准确性与鲁棒性,为相关领域提供了可复现的基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作