five

miniJPAS与J-NEP联合数据集

收藏
arXiv2025-11-26 更新2025-11-27 收录
下载链接:
https://j-pas.org/datareleases
下载链接
链接失效反馈
官方服务:
资源简介:
本研究构建的miniJPAS与J-NEP联合数据集是由J-PAS巡天路径探测器采集的多波段天文观测数据集,覆盖北黄极与AEGIS天区共计1.29平方度天区。数据集包含14,594个经过严格交叉认证的天体源,涵盖60个光学波段的光度测量数据与形态学参数,数据来源整合了SDSS、Gaia、DESI等六大权威巡天项目的光谱与形态分类标签。通过自动化质量控制流程与多源数据融合技术,构建过程确保了样本的纯净度与空间覆盖完整性。该数据集主要应用于星系-恒星分类的机器学习模型训练,旨在解决传统形态学分类在暗弱天体识别中的局限性,为宇宙学大尺度结构研究提供可靠的数据支撑。

The joint miniJPAS and J-NEP dataset constructed in this study is a multi-band astronomical observation dataset collected by the J-PAS survey pathfinder telescope, covering a total of 1.29 square degrees of sky across the North Ecliptic Pole and the AEGIS field. The dataset contains 14,594 rigorously cross-identified astronomical sources, including photometric measurement data across 60 optical bands and morphological parameters. It integrates spectral and morphological classification labels from six authoritative sky survey projects such as SDSS, Gaia, DESI, and others. Through automated quality control workflows and multi-source data fusion technologies, the dataset construction ensures the sample purity and spatial coverage completeness. This dataset is mainly used for training machine learning models for galaxy-star classification, aiming to address the limitations of traditional morphological classification in identifying faint celestial objects, and provide reliable data support for cosmological large-scale structure research.
提供机构:
巴西圣埃斯皮里图联邦大学
创建时间:
2025-11-26
搜集汇总
数据集介绍
main_image_url
构建方式
在星系与恒星分类研究领域,miniJPAS与J-NEP联合数据集的构建采用了多源交叉匹配策略。通过整合SDSS DR12、Gaia EDR3、DEEP3 DR4、Binospec、DESI DR1及HSC-SSP PDR2等权威光谱与测光星表,研究人员系统性地筛选出14,594个具有可靠标签的天体样本。这些样本经过严格的质量控制流程,包括掩膜标志筛选与观测条件校验,最终形成覆盖15<r<23.5星等范围的标准化数据集,为机器学习分类任务提供了坚实的基准真值基础。
特点
该数据集在观测维度上展现出独特优势,其核心特征在于同时包含60个J-PAS窄波段与宽波段的完整测光序列,结合形态学参数如浓度指数、半高全宽和归一化峰值表面亮度。通过UMAP流形分析验证,数据集在特征空间中呈现连续且广泛的覆盖范围,有效支持分类模型的泛化能力。特别值得注意的是,数据集通过星场PSF中值校正技术消除了形态参数的多峰分布现象,使得恒星与星系的形态特征分离度显著提升。
使用方法
在应用层面,该数据集主要服务于基于XGBoost算法的恒星-星系二分类任务。研究人员构建了三种特征配置方案:纯测光特征、纯形态特征及其组合特征,通过TPOT自动化框架进行超参数优化。使用时需将60个波段的MAG_AUTO测光值、形态参数及PSF信息共同输入分类器,模型输出的概率得分可通过设定阈值实现类别划分。数据集附带的增值星表可直接用于宇宙学分析与星系演化研究,其分类性能经ROC曲线与纯度-完备度曲线验证,显著优于传统SGLC分类方法。
背景与挑战
背景概述
miniJPAS与J-NEP联合数据集作为Javalambre加速宇宙物理天体测量巡天计划的探路者项目,由巴西、西班牙等多国研究机构于2025年联合构建。该数据集聚焦于天体形态学与多波段测光特征的深度融合,旨在通过60个滤光片获取的精密光谱数据,解决传统光谱巡天中因目标选择偏差和光纤碰撞导致的数据完整性问题。其核心科学目标在于建立高精度的恒星-星系分类体系,为宇宙学参数测量和星系演化研究提供可靠的数据支撑,显著提升了宽视场成像巡天在时域天文学研究中的科学价值。
当前挑战
该数据集面临的双重挑战体现在科学问题与方法学层面。在科学层面,恒星-星系分类需克服暗弱天体形态趋同导致的判别模糊性,特别是在r波段星等大于22.5时,点源与延展源的光度特征高度退化。在构建层面,数据质量控制需协调六类外部星表(包括DESI、Gaia、SDSS等)的交叉认证,通过优先级排序解决1角秒匹配半径内的源重复问题;同时需消除点扩散函数空间变化对形态参数(如浓度指数、峰值表面亮度)的多峰分布影响,并处理60个测光波段中非探测数据的归一化表征。
常用场景
经典使用场景
在天文学观测领域,miniJPAS与J-NEP联合数据集通过整合60个波段的光度测量与形态学参数,为恒星与星系的精确分离提供了关键数据支撑。该数据集最经典的应用场景在于训练和验证机器学习分类器,特别是XGBoost模型,通过结合光度与形态特征实现高达0.995的ROC曲线下面积,显著提升了天体分类的准确度与可靠性。
衍生相关工作
基于该数据集开发的机器学习框架已衍生出多项重要研究,包括J-PLUS巡天的三分类(星系-恒星-类星体)模型、贝叶斯神经网络分类器BANNJOS,以及结合半监督学习的K均值-随机森林混合方法。这些工作进一步拓展了多波段测光数据在宇宙大尺度结构研究和系外行星探测中的应用边界。
数据集最近研究
最新研究方向
在星系与恒星分类研究领域,miniJPAS与J-NEP联合数据集正推动机器学习方法的前沿探索。该数据集通过整合60波段测光数据与形态学参数,构建了包含14,594个天体的标注样本,为XGBoost算法提供了优质训练基础。当前研究聚焦于多特征融合策略,证实形态学参数(特别是集中度指标与归一化峰值表面亮度)与4000Å、6900Å波段测光特征的协同作用能显著提升分类精度。通过UMAP流形分析验证了数据集的表征完备性,同时采用置换重要性解析揭示了PSF参数在克服观测条件变异性的关键价值。这些进展不仅突破了传统贝叶斯分类器的性能瓶颈,更为下一代大规模巡天项目的天体分类奠定了方法论基础。
相关研究论文
  • 1
    The miniJPAS and J-NEP surveys: Machine learning for star-galaxy separation巴西圣埃斯皮里图联邦大学 · 2025年
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务