juliensimon/solar-flare-events
收藏Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/juliensimon/solar-flare-events
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
pretty_name: "Solar Flare Events (GOES X-ray)"
language:
- en
description: "Individual solar flare detections from NOAA GOES-16 X-ray sensors (2017-present) with class, peak flux, and timing."
task_categories:
- tabular-classification
- time-series-forecasting
tags:
- space
- solar-flare
- goes
- space-weather
- noaa
- open-data
- goes-16
- x-ray
- ncei
- solar-activity
- tabular-data
- parquet
size_categories:
- 10K<n<100K
configs:
- config_name: default
data_files:
- split: train
path: data/solar_flare_events.parquet
default: true
---
# Solar Flare Events
*Part of the [Space Weather Datasets](https://huggingface.co/collections/juliensimon/space-weather-datasets-69c24cae98f1666f2101ca70) collection on Hugging Face.*


Individual solar flare detections from GOES X-ray sensors, spanning **2017-02-09** to
**2026-03-28**. Currently **16,112** flare events from GOES-16, supplemented with
near-real-time detections from NOAA SWPC.
## Dataset description
Solar flares are sudden bursts of electromagnetic radiation from the Sun. They are
classified by peak X-ray flux in the 1-8 Angstrom band: **B** (< 10⁻⁶ W/m²),
**C** (10⁻⁶), **M** (10⁻⁵), and **X** (10⁻⁴ W/m²). M and X-class flares can
cause radio blackouts, GPS errors, satellite anomalies, and geomagnetic storms
that increase atmospheric drag on LEO satellites.
## Schema
| Column | Type | Description |
|--------|------|-------------|
| `start_time` | datetime | Flare start time (UTC) |
| `peak_time` | datetime | Flare peak time (UTC) |
| `end_time` | datetime | Flare end time (UTC) |
| `goes_class` | string | GOES class (e.g. "B3.7", "C1.6", "M5.1", "X1.0") |
| `goes_class_letter` | string | Class letter: B, C, M, or X |
| `peak_flux_wm2` | float64 | Peak X-ray flux in 1-8A band (W/m²) |
| `active_region` | int | NOAA active region number (when available) |
| `satellite` | string | Source satellite (GOES-16, GOES-18) |
## Quick stats
- **16,112** flare events (2017-02-09 to 2026-03-28)
- **9,612** C-class, **1,610** M-class, **82** X-class flares
- Strongest flare: **M1.3** on 2026-03-28 06:06
## Usage
```python
from datasets import load_dataset
ds = load_dataset("juliensimon/solar-flare-events", split="train")
df = ds.to_pandas()
# M and X class flares only
major = df[df["goes_class_letter"].isin(["M", "X"])]
# Flare frequency over time
df["month"] = df["start_time"].dt.to_period("M")
monthly = df.groupby("month").size()
# X-class flares by active region
x_flares = df[df["goes_class_letter"] == "X"]
x_flares["active_region"].value_counts().head(10)
# Flare duration
df["duration_min"] = (df["end_time"] - df["start_time"]).dt.total_seconds() / 60
```
## Data sources
- **Bulk data**: [NCEI GOES-16 XRS Flare Summary](https://data.ngdc.noaa.gov/platforms/solar-space-observing-satellites/goes/goes16/l2/data/xrsf-l2-flsum_science/) (science-quality, 2017-present)
- **Daily supplement**: [NOAA SWPC Event Reports](https://www.swpc.noaa.gov/products/solar-and-geophysical-event-reports) (near-real-time)
Pre-2017 backfill from earlier GOES satellites is planned for a future update.
## Update schedule
Daily at 12:00 UTC via [GitHub Actions](https://github.com/juliensimon/space-datasets).
## Related datasets
- [space-weather-indices](https://huggingface.co/datasets/juliensimon/space-weather-indices) — Daily Kp, Ap, F10.7 indices
- [space-track-satcat](https://huggingface.co/datasets/juliensimon/space-track-satcat) — Full NORAD satellite catalog
- [neo-close-approaches](https://huggingface.co/datasets/juliensimon/neo-close-approaches) — Near-Earth object approaches
## Pipeline
Source code: [juliensimon/space-datasets](https://github.com/juliensimon/space-datasets)
## Support
If you find this dataset useful, please give it a ❤️ on the [dataset page](https://huggingface.co/datasets/juliensimon/solar-flare-events) and share feedback in the Community tab! Also consider giving a ⭐️ to the [space-datasets](https://github.com/juliensimon/space-datasets) repo.
## Citation
```bibtex
@dataset{solar_flares,
author = {Simon, Julien},
title = {Solar Flares},
year = {2026},
publisher = {Hugging Face},
url = {https://huggingface.co/datasets/juliensimon/solar-flare-events},
note = {Based on NOAA/SWPC GOES X-ray flux data}
}
```
## License
[CC-BY-4.0](https://creativecommons.org/licenses/by/4.0/)
提供机构:
juliensimon
搜集汇总
数据集介绍

构建方式
在太阳物理学与空间天气监测领域,太阳耀斑事件的系统性记录对于理解太阳活动规律至关重要。本数据集整合了来自NOAA GOES-16卫星X射线传感器的科学级探测数据,时间跨度自2017年2月9日至2026年4月4日,共收录了16,121个耀斑事件。数据构建过程融合了美国国家环境信息中心(NCEI)提供的经过质量验证的批量历史数据,并辅以美国空间天气预报中心(SWPC)发布的近实时事件报告作为每日补充,确保了数据覆盖的连续性与时效性。数据以Parquet格式存储,并通过自动化工作流每日更新,为研究社区提供了结构清晰、来源可靠的高质量观测记录。
特点
该数据集的核心特征在于其详尽的耀斑物理参数记录。每条数据不仅包含耀斑的开始、峰值与结束时间,还精确标注了基于1-8埃波段峰值流量的GOES分类(B、C、M、X级)及其具体数值。数据集特别突出了GOES-16时代的技术优势,得益于传感器灵敏度与1秒时间分辨率的提升,能够捕捉到以往仪器难以探测的B级微耀斑。此外,数据中关联了NOAA活动区编号,使得研究者能够深入分析特定磁活动区域的产率,为耀斑预测与太阳周期统计研究提供了多维度的分析基础。
使用方法
该数据集适用于表格分类与时间序列预测等多种机器学习任务。用户可通过Hugging Face的`datasets`库便捷加载数据,并利用Pandas进行进一步处理。典型应用包括筛选M级与X级等主要耀斑事件、按时间维度统计耀斑发生频率、分析特定活动区产生X级耀斑的规律,以及计算耀斑持续时间等衍生物理量。这些分析直接服务于太阳耀斑预测模型构建、空间天气影响评估以及太阳活动长期统计研究,为相关领域的算法开发与实证分析提供了标准化数据支撑。
背景与挑战
背景概述
太阳耀斑事件数据集由Julien Simon于2026年构建,依托美国国家海洋和大气管理局(NOAA)的GOES-16卫星X射线传感器数据,涵盖了自2017年2月至今的太阳耀斑探测记录。该数据集聚焦于空间天气研究领域的核心问题,即通过高精度时序数据解析太阳耀斑的爆发机制及其对地球环境的潜在影响。GOES-16卫星凭借其增强的X射线敏感度与秒级观测频率,显著提升了B级微耀斑的探测能力,为太阳活动周期统计、耀斑预测模型以及空间天气风险评估提供了关键数据支撑,推动了太阳物理学与空间气象学的交叉研究进展。
当前挑战
在太阳耀斑研究领域,准确预测高能耀斑(如M级和X级)的爆发时间与强度仍是重大挑战,这类事件可能引发无线电中断、卫星异常等严重空间天气效应。数据构建过程中,面临多源异构数据的整合难题,包括科学级历史数据与近实时探测记录的校准,以及早期GOES卫星数据的回溯填充尚未完成。此外,耀斑时间剖面(起始、峰值、结束)的精确标注依赖于复杂的信号处理算法,以区分背景噪声与真实事件,这对数据质量的一致性提出了较高要求。
常用场景
经典使用场景
在太阳物理学与空间气象学领域,太阳耀斑事件的预测与分类是核心研究课题。Solar Flare Events数据集以其高精度的时间序列记录,为机器学习模型提供了训练与验证的基础。研究者常利用该数据集构建分类模型,依据耀斑的起始、峰值时间及X射线通量等特征,自动识别B、C、M、X不同等级的耀斑事件。这种应用不仅提升了事件检测的自动化水平,还为深入理解耀斑爆发的物理机制提供了数据支撑。
解决学术问题
该数据集有效应对了太阳活动研究中数据稀缺与标准化不足的挑战。通过整合GOES-16卫星的X射线传感器数据,它提供了连续且统一的耀斑事件记录,解决了以往数据分散、格式不一的问题。这使得学者能够系统分析耀斑的时空分布规律,探究活跃区域与耀斑爆发之间的关联,进而推动太阳周期统计模型和空间天气影响评估方法的发展,为理论模型的验证提供了可靠依据。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。学者们利用其构建了多种耀斑预测模型,如基于时间序列分析的统计方法和深度学习网络,这些模型旨在提前数小时至数天预警重大耀斑事件。此外,数据集还支持了活跃区域生产力分析,相关成果被应用于改进空间天气预报框架,并促进了跨学科研究,如太阳活动与地球气候系统的相互作用探索。
以上内容由遇见数据集搜集并总结生成



