five

基于盖亚XP光谱的红巨星金属丰度数据集

收藏
arXiv2025-05-08 更新2025-05-10 收录
下载链接:
https://doi.org/10.12149/101604
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集由北京师范大学天文与天体物理前沿研究院的研究团队创建,包含约2000万颗红巨星的金属丰度估计值,其中包括36万颗非常贫金属星和5万颗极度贫金属星。数据集基于盖亚任务DR3版本提供的低分辨率光谱数据,利用不确定性感知成本敏感神经网络模型(UA-CSNet)进行金属丰度的估计。该模型能够处理光谱输入中的随机误差和金属丰度值的不均衡分布,从而提高了预测的精度,特别是对于非常贫金属星。数据集对研究银河系的形成和化学动力演化具有重要价值,相关研究论文发表在arXiv上。

This dataset was created by the research team from the Institute for Advanced Study in Astronomy and Astrophysics, Beijing Normal University. It contains metallicity estimates for approximately 20 million red giants, including 360,000 very metal-poor stars and 50,000 extremely metal-poor stars. Based on low-resolution spectroscopic data from the Gaia Mission Data Release 3 (DR3), the metallicity values were estimated using an uncertainty-aware cost-sensitive neural network (UA-CSNet). This model can handle random errors in spectroscopic inputs and the imbalanced distribution of metallicity values, thereby improving prediction accuracy, especially for very metal-poor stars. This dataset holds significant value for studies on the formation and chemical and dynamical evolution of the Milky Way, and the relevant research paper has been published on arXiv.
提供机构:
北京师范大学天文与天体物理前沿研究院
创建时间:
2025-05-08
搜集汇总
数据集介绍
main_image_url
构建方式
基于盖亚XP光谱的红巨星金属丰度数据集通过精心设计的深度学习模型UA-CSNet构建而成。该模型结合了盖亚DR3发布的低分辨率BP/RP光谱数据,并利用PASTEL和SAGA高分辨率光谱星表作为训练和验证样本。研究团队首先对盖亚XP光谱进行了系统误差校正和消光修正,随后通过重采样和归一化处理,将光谱数据转换为60维特征向量。UA-CSNet采用双分支架构,分别预测金属丰度及其不确定性,同时通过代价敏感学习机制解决了金属贫乏星样本不足的问题。模型训练采用了包含1012颗红巨星的PASTEL样本,并确保训练集与649颗SAGA测试星无交叉污染。
特点
该数据集最显著的特点是覆盖了约2000万颗红巨星的金属丰度估计,其中包括36万颗极贫金属星(VMP,[Fe/H]≤-2.0)和5万颗极端贫金属星(EMP,[Fe/H]≤-3.0)。数据质量方面,对于[Fe/H]>-2.0的恒星,金属丰度估计精度达0.09-0.12 dex;对于贫金属星,精度保持在0.17-0.22 dex。特别值得注意的是,该数据集成功克服了碳增强对金属丰度估计的系统性影响,这在同类研究中具有突破性意义。此外,数据集还提供了每个金属丰度估计的误差范围,为后续科学研究提供了可靠性评估依据。
使用方法
该数据集适用于银河系化学演化、恒星形成历史等天体物理研究领域。使用时应首先筛选符合以下条件的样本:消光E(B-V)<0.5、BP-RP颜色在0.7-1.9范围内、光变因子phot_bp_rp_excess_factor满足质量控制条件。对于G星等>15的样本,建议谨慎使用其误差估计。数据可通过DOI:10.12149/101604公开获取,包含源ID、天球坐标、修正后的测光参数、金属丰度[Fe/H]及其误差等关键字段。研究证实该数据与APOGEE、LAMOST等光谱巡天结果在[Fe/H]>-3.5范围内具有良好一致性,但在分析极贫金属星时需考虑0.2-0.3 dex的系统差异。
背景与挑战
背景概述
基于盖亚XP光谱的红巨星金属丰度数据集由杨琳等研究人员于2025年创建,旨在利用盖亚任务(Gaia mission)提供的低分辨率BP/RP(XP)光谱数据,估计红巨星的金属丰度([Fe/H])。该数据集的核心研究问题是通过数据驱动的方法,特别是基于不确定性感知的成本敏感神经网络(UA-CSNet),从低分辨率光谱中精确估计金属丰度,尤其是对于极贫金属星(VMP; [Fe/H] ≤ −2.0)和极端贫金属星(EMP; [Fe/H] ≤ −3.0)。该数据集包含约2000万颗红巨星的金属丰度估计,为研究银河系的形成和化学动力学演化提供了宝贵资源。
当前挑战
该数据集解决的领域问题是从低分辨率光谱中精确估计金属丰度,尤其是对于极贫金属星和极端贫金属星。构建过程中遇到的挑战包括:1) 低分辨率光谱的信噪比(S/N)较低,导致金属丰度估计的精度受限;2) 训练数据中金属丰度的分布不平衡,极贫金属星的样本较少,影响模型的泛化能力;3) 光谱中的系统误差和消光校正的不确定性,可能引入额外的偏差;4) 极贫金属星的光谱特征较弱,容易被其他因素(如碳增强)干扰,导致金属丰度估计的偏差。
常用场景
经典使用场景
基于盖亚XP光谱的红巨星金属丰度数据集在天文学领域被广泛应用于研究银河系的化学演化历史。该数据集通过高精度的光谱分析,为红巨星提供了可靠的金属丰度估计,尤其适用于探索银河系不同区域的化学元素分布及其随时间的变化。研究人员利用该数据集可以深入分析金属贫乏恒星(VMP和EMP)的分布特征,为银河系形成和演化模型提供关键观测约束。
实际应用
在实际应用方面,该数据集已被整合到多个大型巡天项目的后续分析中,如LAMOST和SDSS/SEGUE。天文学家利用这些数据绘制了银河系化学丰度分布图,识别出大量金属贫乏恒星候选体,为研究银河系晕和厚盘的组装历史提供了重要样本。此外,该数据集还被用于校准其他巡天项目的金属丰度测量结果,显著提高了低分辨率光谱数据的科学价值。
衍生相关工作
该数据集衍生了一系列重要研究工作,包括开发新的金属丰度估计算法、构建银河系化学演化模型等。基于该数据集,研究人员提出了改进的光谱分析方法,如将UA-CSNet架构应用于其他巡天数据;同时催生了多项关于银河系形成历史的研究,特别是对早期宇宙恒星形成率和大质量恒星核合成过程的限制。这些工作显著推进了我们对银河系化学演化历史的理解。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作