机器学习预测红移的长伽马射线暴(LGRB)样本
收藏arXiv2025-10-09 更新2025-10-10 收录
下载链接:
https://github.com/gammarayapp/GRB-Web-App
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了通过机器学习模型预测红移的长伽马射线暴(LGRB)样本,旨在研究LGRB随宇宙形成历史的演化。数据集由克莱姆森大学物理与天文学系等研究机构提供,包含了446个LGRB样本,数据来源于Neil Gehrels Swift Observatory。数据集的创建过程使用了机器学习模型,基于LGRB的快速和X射线或光学余辉参数进行红移预测。该数据集应用于研究LGRB的演化,旨在解决宇宙学和高能物理学中的问题。
This dataset contains samples of long gamma-ray bursts (LGRBs) with their redshifts predicted by machine learning models, and is designed to study the evolution of LGRBs along the cosmic formation history. Provided by research institutions including the Department of Physics and Astronomy at Clemson University, the dataset comprises 446 LGRB samples with data sourced from the Neil Gehrels Swift Observatory. It was developed using machine learning models to conduct redshift predictions based on the prompt and X-ray or optical afterglow parameters of LGRBs, and is applied to research on LGRB evolution with the goal of addressing issues in cosmology and high-energy physics.
提供机构:
克莱姆森大学物理与天文学系, 美国南卡罗来纳州克莱姆森
创建时间:
2025-10-09
原始信息汇总
Redshift-Estimator (X-ray) 数据集概述
数据集简介
Redshift-estimator (X-ray) 是一个可靠的集成机器学习框架,专门用于基于伽马射线暴在X射线波段的特征来估计其红移值。该框架利用伽马射线暴光变曲线的所有X射线阶段作为特征来训练和测试模型。
技术特点
- 使用伽马射线暴光变曲线的所有X射线阶段:X射线爆发期、X射线平台期和X射线余辉期
- 采用集成机器学习框架,结合多种机器学习算法
- 集成SuperLearner方法,而非传统单一算法
- 包含异常值去除、特征选择和缺失数据填补等机器学习技术
主要功能
- 在新伽马射线暴被探测到时快速预测其红移值
- 为其他观测设施提供快速精确的后续观测支持
- 通过特征选择减少维度并提高回归性能
- 通过填补缺失数据增加样本规模
技术规格
- 编程语言:R 4.3、Python 3.8
- 许可证:GNU GPL v3.0
- 文档状态:最新版本可用
相关资源
- 文档:https://grb-web-app.readthedocs.io/en/latest/
- 论文预印本:arXiv:2410.13985
- 许可证文件:https://github.com/gammarayapp/GRB-Web-App/blob/main/LICENSE
开发团队
由Maria Giovanna Dainotti、Malgorzata Bogdan、Aditya Narendra、Agnieszka Pollo、Milind Sarkar、Aleksander Lenart、Aleksandra Rabeda等研究人员共同开发。
联系方式
如有问题可通过电子邮件联系:mariagiovannadainotti@xxxxx.it
搜集汇总
数据集介绍

构建方式
在伽马射线暴天体物理学研究中,针对80%缺乏光谱红移测量的长伽马射线暴样本,本研究通过机器学习方法构建了红移预测数据集。基于Swift卫星观测的242个具有X射线平台期和已知光谱红移的伽马射线暴作为训练集,采用X射线平台相关性与暴发参数作为特征输入,通过机器学习模型成功预测了276个缺乏红移测量的伽马射线暴红移值。经过数据清洗剔除异常值后,最终形成包含228个预测样本和470个混合样本的高质量数据集。
特点
该数据集最显著的特征在于突破了传统红移测量对余辉观测的依赖,通过机器学习实现了红移的宇宙学无关性预测。数据集包含经过严格筛选的伽马射线暴样本,所有样本均具有X射线平台期特征,且通过Efron-Petrosian方法进行了本征光度演化校正。特别值得注意的是,数据集通过Kolmogorov-Smirnov检验确保了样本完整性,并采用分段函数拟合策略精确描述了累积红移分布,为研究伽马射线暴形成率密度演化提供了可靠的数据基础。
使用方法
该数据集主要用于研究长伽马射线暴形成率密度随宇宙学红移的演化规律。研究者可通过计算累积分布函数的导数获得形成率密度曲线,并利用Drake方程将观测形成率密度与恒星形成率密度进行对比分析。数据集支持三种应用场景:无演化模型检验、喷流因子演化研究以及综合演化因子分析。使用过程中需考虑仪器灵敏度阈值校正、观测时间覆盖因子和视场修正因子,以确保形成率密度计算的准确性。
背景与挑战
背景概述
长伽马射线暴(LGRB)作为宇宙恒星形成的探针,其红移测量对理解高红移宇宙演化至关重要。传统红移测定依赖光谱或测光观测,但约80%的GRB缺乏此类数据。由Clemson大学、贾吉洛尼亚大学等机构研究人员于2025年提出的机器学习预测红移样本,通过结合暴发和余辉参数构建机器学习模型,规避了传统方法对宇宙学假设的依赖。该数据集通过增强包含实测与预测红移的GRB样本,显著扩展了可用于研究GRB特性演化的数据基础,为探索恒星形成率密度与GRB形成率的关联提供了新视角。
当前挑战
在解决GRB红移预测领域问题时,主要挑战在于传统方法受限于仪器探测阈值和宇宙学假设引入的系统误差。构建过程中面临的挑战包括:样本非均匀性导致部分长GRB可能源自非塌缩星机制;机器学习模型训练数据有限,需平衡光学与X射线余辉样本的整合;仪器灵敏度差异引发的选择偏差,以及GRB分类标准(T90>2秒)可能混淆塌缩星与并合起源的GRB。
常用场景
经典使用场景
在伽马射线暴宇宙学研究中,该数据集通过机器学习预测的红移值显著扩展了长伽马射线暴样本的统计规模。研究者利用Swift卫星观测的X射线平台期数据,结合Efron-Petrosian方法进行光度演化校正,构建了包含470个伽马射线暴的增强样本。这一数据集使得在红移1-6范围内对伽马射线暴形成率密度进行精确测量成为可能,为研究恒星形成历史与伽马射线暴演化的关联提供了关键数据支撑。
实际应用
在实际应用层面,该数据集为多信使天文学研究提供了重要工具。通过机器学习预测的红移值,天文学家能够更准确地定位伽马射线暴的宿主星系,促进光学和射电望远镜的协同观测。在宇宙学参数约束方面,扩展的伽马射线暴样本可用于验证不同红移区间的恒星形成率密度模型,特别是对詹姆斯·韦伯空间望远镜发现的高红移星系形成率异常现象提供独立检验。此外,该数据集还为研究伽马射线暴前身星系统的金属度演化等物理过程提供了观测依据。
衍生相关工作
该数据集催生了多项重要的衍生研究。Narendra等人基于X射线平台期相关性开发的机器学习红移预测模型,为后续光学与X射线样本的联合分析奠定了基础。Khatiya等人的研究利用该数据集构建了伽马射线暴形成率密度的完整演化图像,并与多种恒星形成率模型进行系统比较。Dainotti团队进一步将分析方法扩展到光学波段,揭示了不同能段观测对伽马射线暴率密度测量的影响。这些工作共同推动了对伽马射线暴作为宇宙恒星形成示踪剂的深入理解。
以上内容由遇见数据集搜集并总结生成



