five

模拟引力微透镜伽马射线暴数据集

收藏
arXiv2025-04-29 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2504.19958v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个模拟引力微透镜伽马射线暴的数据集,包含2000个模拟引力透镜伽马射线暴的光曲线和2000个非引力透镜伽马射线暴的光曲线。数据集由伊朗德黑兰工业大学物理系、伊朗德黑兰天文学研究学院、伊朗德黑兰夏里夫大学物理系、伊朗德黑兰夏里夫大学高能物理研究中心、阿曼苏丹国马斯喀特学院物理系的研究人员创建。数据集用于训练机器学习模型,以区分引力透镜伽马射线暴和非引力透镜伽马射线暴。数据集的创建过程包括从费米伽马射线暴监测器(GBM)中提取长伽马射线暴的光曲线数据,并通过蒙特卡洛模拟生成模拟引力透镜伽马射线暴的光曲线。数据集的应用领域是引力透镜伽马射线暴的识别,旨在解决引力透镜伽马射线暴识别的难题。

This dataset is a collection of simulated gravitational microlensing gamma-ray burst (GRB) light curves, which contains 2000 simulated gravitational microlensing GRB light curves and 2000 non-lensed GRB light curves. It was created by researchers from the Department of Physics, Tehran Polytechnic University, Tehran, Iran; School of Astronomy Research, Tehran, Iran; Department of Physics, Sharif University of Technology, Tehran, Iran; High Energy Physics Research Center, Sharif University of Technology, Tehran, Iran; and Department of Physics, College of Muscat, Sultanate of Oman. This dataset is designed to train machine learning models to differentiate between gravitational microlensing GRBs and non-lensed GRBs. The dataset construction process includes extracting long GRB light curve data from the Fermi Gamma-ray Burst Monitor (GBM), and generating simulated gravitational microlensing GRB light curves via Monte Carlo simulations. The application field of this dataset focuses on gravitational microlensing GRB identification, aiming to address the challenges in gravitational microlensing GRB recognition.
提供机构:
伊朗德黑兰工业大学物理系、伊朗德黑兰天文学研究学院、伊朗德黑兰夏里夫大学物理系、伊朗德黑兰夏里夫大学高能物理研究中心、阿曼苏丹国马斯喀特学院物理系
创建时间:
2025-04-29
搜集汇总
数据集介绍
main_image_url
构建方式
模拟引力微透镜伽马射线暴数据集通过蒙特卡洛模拟构建,基于费米伽马射线暴监测器(GBM)观测的长暴(T90≥2秒)光变曲线数据。研究采用点质量透镜模型,模拟质量范围在10^3至10^7太阳质量之间的透镜效应,生成包含2000个透镜化和2000个非透镜化GRB光变曲线的平衡数据集。透镜化样本通过叠加原始光变曲线并引入引力延迟时间和放大率比生成,而非透镜化样本则通过随机组合不同GRB的光变曲线构建,确保两类样本在时间结构和统计特性上具有显著区分性。
特点
该数据集的核心特点在于其物理驱动的模拟方法,严格遵循引力微透镜理论框架,确保生成的透镜化光变曲线具有真实的时域特征(如双峰结构、相同时间轮廓的重复脉冲)。通过Cesium工具包提取的21维特征(包括振幅、偏度、Stetson J/K变异性指标等)全面捕捉光变曲线的统计特性和时域模式。数据集的平衡设计和高质量标注(94%的随机森林分类准确率)使其成为机器学习算法验证的理想基准,尤其适用于稀有天体物理事件的分类研究。
使用方法
数据集适用于监督学习框架下的二元分类任务,建议采用80-20比例划分训练集与测试集。特征矩阵需经过标准化处理以优化模型性能,优先推荐集成学习方法(如随机森林)。研究证实,基于Gini重要性排序的特征选择可显著提升模型效率,其中'n_epochs'和'median_absolute_deviation'等关键特征对分类贡献度最高。该数据集还可用于迁移学习研究,将其特征提取模式应用于其他瞬变天体光变曲线的分析。
背景与挑战
背景概述
模拟引力微透镜伽马射线暴数据集由Mohammad H. Zhoolideh Haghighi等研究人员于2025年创建,旨在通过机器学习方法识别引力微透镜效应在伽马射线暴(GRBs)中的表现。伽马射线暴作为宇宙中最明亮的瞬变事件之一,其引力透镜效应为研究宇宙中的紧凑暗物质和小尺度结构提供了独特机会。该数据集基于费米伽马射线暴监测器(GBM)的观测数据,通过蒙特卡洛模拟生成了包含2000个透镜化和非透镜化GRB光曲线的样本,为相关领域的研究提供了重要工具。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题方面,引力微透镜效应在GRB光曲线中表现为微弱的重复峰值,其与内在爆发特征的区分极具挑战性,传统方法难以有效识别;在构建过程方面,模拟数据需要精确复现透镜效应的时间延迟和放大率等物理参数,同时确保非透镜化样本的多样性以反映真实观测的复杂性,这对特征工程和模型泛化能力提出了较高要求。
常用场景
经典使用场景
在伽马射线暴(GRB)研究中,模拟引力微透镜伽马射线暴数据集被广泛应用于机器学习模型的训练与验证,以区分透镜化和非透镜化的GRB光变曲线。该数据集通过蒙特卡洛模拟生成,包含2000条透镜化和2000条非透镜化GRB光变曲线,涵盖了时间延迟和放大率等关键物理参数。研究者利用Cesium工具包提取光变曲线的统计与时域特征,结合随机森林等算法,实现了高达94%的分类准确率,为引力透镜效应的自动化检测提供了可靠基准。
解决学术问题
该数据集有效解决了天体物理学中两个核心问题:一是通过量化透镜化GRB光变曲线的特征差异(如双峰结构、时间延迟),为探测宇宙中致密暗物质分布提供了新方法;二是突破了传统人工筛选的局限性,利用机器学习处理海量观测数据,显著提升了稀有引力透镜事件的识别效率。其意义在于首次建立了GRB微透镜效应的系统性模拟框架,推动了多信使天文学与暗物质研究的交叉融合。
衍生相关工作
基于该数据集的方法论催生了多项经典研究:Kalantari等人(2021)扩展了透镜质量函数的约束范围;Zhoolideh Haghighi团队(2025)开发了融合卷积神经网络的混合模型,进一步提升分类鲁棒性;后续工作还衍生出GRB红移预测(Krumpe et al. 2007)和光谱参数估计(Wang et al. 2020)等分支方向,形成了以机器学习为核心的多学科交叉研究范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作