five

auger-cosmic-rays

收藏
Hugging Face2026-04-02 更新2026-04-03 收录
下载链接:
https://huggingface.co/datasets/juliensimon/auger-cosmic-rays
下载链接
链接失效反馈
官方服务:
资源简介:
Pierre Auger Observatory宇宙射线数据集包含了来自Pierre Auger天文台的宇宙射线事件摘要数据。该天文台位于阿根廷门多萨,拥有世界上最大的超高能宇宙射线探测器,由分布在3000平方公里范围内的1660个水切伦科夫表面探测器和荧光望远镜组成,用于探测能量超过10^18 eV的宇宙射线。这些宇宙射线是自然界中已知的最具能量的粒子,其起源仍然是天体物理学中最大的未解之谜之一。数据集包含24,319条记录,涵盖了多种观测参数,如能量、方向、大气深度等,适用于超高能宇宙射线的研究、多信使天体物理学研究以及与强子相互作用模型的验证。数据集以parquet格式提供,详细的数据模式(schema)在README中列出。数据来源于Pierre Auger Observatory的开放数据发布,遵循CC-BY-4.0许可。
创建时间:
2026-03-25
原始信息汇总

Pierre Auger Observatory Cosmic Rays 数据集概述

基本信息

  • 数据集名称:Pierre Auger Observatory Cosmic Rays
  • 发布者:Julien Simon
  • 发布日期:2026年
  • 发布平台:Hugging Face
  • 数据集地址:https://huggingface.co/datasets/juliensimon/auger-cosmic-rays
  • 许可协议:CC-BY-4.0 (https://creativecommons.org/licenses/by/4.0/)
  • 语言:英语
  • 任务类别:表格回归
  • 标签:空间、物理、宇宙射线、auger、超高能、开放数据、表格数据、parquet
  • 数据规模:1K<n<10K
  • 记录数量:24,319条

数据集描述

该数据集包含来自阿根廷门多萨皮埃尔·奥格天文台的宇宙射线事件摘要数据。皮埃尔·奥格天文台是世界上最大的超高能宇宙射线探测器,使用分布在3000平方公里范围内的1660个水切伦科夫地面探测器以及荧光望远镜,探测能量超过10^18 eV的宇宙射线。这些是自然界中已知能量最高的粒子,其起源仍然是天体物理学中最大的未解之谜之一。

该数据集包含了来自Zenodo上奥格开放数据发布的摘要级事件数据。超高能宇宙射线是自然界中观测到的能量最高的粒子,单个事件携带宏观量的动能。当这样的粒子撞击大气层时,会引发一个由数十亿次级粒子组成的广延大气簇射。皮埃尔·奥格天文台通过混合技术探测这些簇射:地面探测器阵列测量簇射粒子在地面的横向分布和时间,而荧光望远镜则观测簇射发展过程中被激发的大气氮气发出的紫外光。这种组合提供了簇射的能量和大气最大深度,这是推断初级宇宙射线质量成分的关键观测指标。

数据内容与结构

  • 数据格式:Parquet
  • 配置名称:default
  • 数据文件data/auger_cosmic_rays.parquet
  • 数据分割:train

数据模式(Schema)

数据集包含以下主要列(均为数值或对象类型):

  • 事件标识id, sdid
  • 时间信息gpstime, sd_gpsnanotime, fd_gpsnanotime
  • 几何与方向参数sd_theta, sd_phi, sd_l, sd_b, sd_ra, sd_dec, fd_theta, fd_phi, fd_l, fd_b, fd_ra, fd_dec 及其误差项
  • 能量参数sd_energy, fd_total_energy, fd_cal_energy 及其误差项
  • 位置坐标sd_x, sd_y, sd_z, sd_easting, sd_northing, sd_altitude, fd_x, fd_y, fd_z, fd_easting, fd_northing, fd_altitude 及其误差项
  • 簇射参数sd_r, sd_s1000, sd_s38, sd_beta, sd_gamma, fd_xmax, fd_height_xmax, fd_dist_xmax, fd_cherenkov_fraction
  • 拟合质量参数sd_chi2, sd_ndf, sd_geochi2, sd_geondf
  • 其他参数sd_standard, multi_eye, sd_gcorr, sd_wcorr, sd_nbstat, fd_id, fd_hd_spectrum_eye, fd_hd_calib_eye, fd_hd_xmax_eye, fd_min_view_angle, fd_usp_l, fd_usp_r, fd_hottest_station_id, fd_dist_sdp_station, fd_dist_axis_station, sd_exposure, source_file

数据来源

  • 原始数据:Pierre Auger Observatory Open Data (https://www.auger.org/)
  • Zenodo DOI:10.5281/zenodo.4487613 (https://doi.org/10.5281/zenodo.4487613)

数据处理管道

  • 源代码仓库:juliensimon/space-datasets (https://github.com/juliensimon/space-datasets)

使用方式

python from datasets import load_dataset

ds = load_dataset("juliensimon/auger-cosmic-rays", split="train") df = ds.to_pandas() print(f"{len(df):,} Auger events") print(df.describe())

引用格式

bibtex @dataset{auger_cosmic_rays, author = {Simon, Julien}, title = {Pierre Auger Observatory Cosmic Rays}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/juliensimon/auger-cosmic-rays}, note = {Based on Pierre Auger Observatory open data (Zenodo 10.5281/zenodo.4487613)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在超高能宇宙射线研究领域,数据采集依赖于大规模探测设施的综合观测能力。Pierre Auger天文台作为全球最大的超高能宇宙射线探测器,通过部署于阿根廷门多萨的1660个水切伦科夫地表探测器阵列与荧光望远镜组成的混合探测系统,实现对能量超过10^18电子伏特的宇宙射线事例的捕获。该数据集基于天文台公开的数据发布,经过标准化处理与汇总,形成了包含24,319条记录的结构化表格,每一行代表一个独立的宇宙射线空气簇射事件,涵盖了地表探测器与荧光望远镜的多维度观测参数。
特点
该数据集的核心特征在于其蕴含的物理信息深度与观测技术的独特性。它不仅提供了每个宇宙射线事例的能量、方向角、天球坐标等基本物理量,更包含了如大气深度最大值Xmax这类对宇宙射线成分敏感的关键观测量。数据集中同时整合了地表探测器阵列测量的簇射横向分布、定时信息,以及荧光望远镜记录的紫外发光剖面,实现了对同一事例的多重独立观测。这种混合探测设计使得数据集能够支持对宇宙射线能谱、各向异性及质量组成等前沿科学问题的深入探索,为理解这些自然界最高能粒子的起源提供了坚实的数据基础。
使用方法
为利用该数据集开展科学研究,研究者可通过Hugging Face的datasets库便捷加载。使用Python代码`load_dataset("juliensimon/auger-cosmic-rays", split="train")`即可获取数据集,并可进一步转换为Pandas DataFrame进行后续分析。数据集以Parquet格式存储,确保了高效的读取与处理性能。用户可基于提供的丰富字段,进行宇宙射线能谱拟合、 arrival direction各向异性分析、Xmax分布与成分关联研究,或与中微子、伽马射线源表进行多信使天体物理关联分析。该开放数据集为验证超出大型强子对撞机能标范围的强子相互作用模型提供了独特的实验数据。
背景与挑战
背景概述
超高能宇宙射线作为自然界中已知能量最高的粒子,其起源与传播机制是当代天体物理学中悬而未决的核心谜题之一。为探索这一前沿领域,位于阿根廷门多萨的皮埃尔·奥格天文台自2004年投入运行,通过由1660个水切伦科夫地表探测器与荧光望远镜组成的混合探测系统,对能量超过10^18电子伏特的宇宙射线进行系统性观测。该数据集汇集了天文台公开的24319条超高能宇宙射线事件摘要数据,为研究宇宙射线的能谱特征、各向异性分布及质量成分提供了关键实证基础,推动了多信使天体物理学与高能粒子相互作用模型的发展。
当前挑战
在超高能宇宙射线研究领域,核心挑战在于追溯这些粒子的天体物理起源,并理解其加速机制与传播过程中的能量损失效应。具体而言,宇宙射线在抵达地球前可能因星际与星系际磁场的偏转而模糊其源方向,且能谱在约5×10^19电子伏特附近出现的GZK截断现象对源的距离与成分提出了严格约束。数据构建过程中,需克服混合探测系统在庞大观测面积内实现时间同步与空间标定的技术难题,并处理由大气条件变化、探测器响应不确定性以及本底噪声引入的系统误差,以确保能量重建与成分推断的可靠性。
常用场景
经典使用场景
在超高能宇宙射线研究领域,该数据集为天体物理学家提供了关键观测数据,经典使用场景包括分析宇宙射线的能量谱分布、各向异性特征以及质量组成。研究人员利用其包含的地面探测器与荧光望远镜的混合测量数据,重建广延大气簇射的横向分布与纵向发展,进而推断原初粒子的能量、方向及成分,为探索宇宙极端加速机制奠定实证基础。
解决学术问题
该数据集有效应对了超高能宇宙射线起源与传播这一长期悬而未决的学术难题。通过提供大量精确的事件记录,它助力验证GZK截断现象,揭示能谱在约5×10^19电子伏特以上的陡化;其各向异性分析为宇宙射线的河外起源提供了证据;而大气深度最大值(Xmax)的测量则约束了原初粒子的质量组成,从质子主导过渡到较重核素,这些成果深刻影响了天体粒子物理模型的发展。
衍生相关工作
围绕该数据集衍生的经典工作广泛而深入,包括对Auger观测站主要科学成果的独立复现与拓展分析,例如能谱各向异性的精细测绘和成分演化的统计研究。许多研究利用该开放数据开展多信使关联分析,探索宇宙射线与高能天体现象的关联;亦有工作将其用于机器学习方法的测试,开发新型事件重建与分类算法,推动了计算天体物理学的进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作