five

sdss_gaia_crossmatched

收藏
Hugging Face2025-07-20 更新2025-07-21 收录
下载链接:
https://huggingface.co/datasets/Smith42/sdss_gaia_crossmatched
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从斯隆数字巡天(SDSS)和盖亚(Gaia)任务中交叉匹配的样本集合,包含多种天文测量和测光数据。数据集的特征包括不同类型的浮点数和结构化数据,涵盖了从光谱流量到天体测量参数的各种信息。
创建时间:
2025-07-15
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Crossmatched samples from the Multimodal Universe for SDSS/Gaia
  • 许可证: CC-BY-4.0
  • 下载大小: 2,227,422,107 字节
  • 数据集大小: 2,670,514,170 字节
  • 训练集样本数量: 41,901

数据集特征

主要特征

  • SPECTROFLUX_I: float32
  • SPECTROFLUX_IVAR_Z: float32
  • SPECTROSYNFLUX_IVAR_U: float32
  • SPECTROFLUX_IVAR_I: float32
  • SPECTROSYNFLUX_IVAR_Z: float32
  • SPECTROFLUX_Z: float32
  • ZWARNING: bool
  • SPECTROFLUX_U: float32
  • SPECTROFLUX_IVAR_R: float32
  • SPECTROSYNFLUX_IVAR_R: float32
  • dec: float32
  • VDISP_ERR: float32
  • ra: float32
  • SPECTROSYNFLUX_I: float32
  • SPECTROSYNFLUX_IVAR_I: float32
  • sdss_object_id: string
  • gaia_object_id: int64
  • Z_ERR: float32
  • Z: float32
  • SPECTROFLUX_R: float32
  • SPECTROSYNFLUX_G: float32
  • SPECTROSYNFLUX_IVAR_G: float32
  • VDISP: float32
  • SPECTROFLUX_IVAR_U: float32
  • SPECTROSYNFLUX_U: float32
  • SPECTROFLUX_G: float32
  • SPECTROFLUX_IVAR_G: float32
  • SPECTROSYNFLUX_Z: float32
  • SPECTROSYNFLUX_R: float32
  • healpix: int64

结构化特征

corrections

  • ecl_lat: float32
  • ecl_lon: float32
  • nu_eff_used_in_astrometry: float32
  • pseudocolour: float32
  • astrometric_params_solved: float32
  • rv_template_teff: float32
  • grvs_mag: float32

photometry

  • phot_g_mean_mag: float32
  • phot_g_mean_flux: float32
  • phot_g_mean_flux_error: float32
  • phot_bp_mean_mag: float32
  • phot_bp_mean_flux: float32
  • phot_bp_mean_flux_error: float32
  • phot_rp_mean_mag: float32
  • phot_rp_mean_flux: float32
  • phot_rp_mean_flux_error: float32
  • phot_bp_rp_excess_factor: float32
  • bp_rp: float32
  • bp_g: float32
  • g_rp: float32

radial_velocity

  • radial_velocity: float32
  • radial_velocity_error: float32
  • rv_template_fe_h: float32
  • rv_template_logg: float32
  • rv_template_teff: float32

astrometry

  • ra: float32
  • ra_error: float32
  • dec: float32
  • dec_error: float32
  • parallax: float32
  • parallax_error: float32
  • pmra: float32
  • pmra_error: float32
  • pmdec: float32
  • pmdec_error: float32
  • ra_dec_corr: float32
  • ra_parallax_corr: float32
  • ra_pmra_corr: float32
  • ra_pmdec_corr: float32
  • dec_parallax_corr: float32
  • dec_pmra_corr: float32
  • dec_pmdec_corr: float32
  • parallax_pmra_corr: float32
  • parallax_pmdec_corr: float32
  • pmra_pmdec_corr: float32

flags

  • ruwe: float32

gspphot

  • ag_gspphot: float32
  • ag_gspphot_lower: float32
  • ag_gspphot_upper: float32
  • azero_gspphot: float32
  • azero_gspphot_lower: float32
  • azero_gspphot_upper: float32
  • distance_gspphot: float32
  • distance_gspphot_lower: float32
  • distance_gspphot_upper: float32
  • ebpminrp_gspphot: float32
  • ebpminrp_gspphot_lower: float32
  • ebpminrp_gspphot_upper: float32
  • logg_gspphot: float32
  • logg_gspphot_lower: float32
  • logg_gspphot_upper: float32
  • mh_gspphot: float32
  • mh_gspphot_lower: float32
  • mh_gspphot_upper: float32
  • teff_gspphot: float32
  • teff_gspphot_lower: float32
  • teff_gspphot_upper: float32

spectral_coefficients

  • coeff: float32
  • coeff_error: float32

spectrum

  • flux: float32
  • ivar: float32
  • lsf_sigma: float32
  • lambda: float32
  • mask: bool

数据配置

  • 配置名称: default
  • 数据文件路径: data/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在当代天体物理学研究中,多源天文数据的交叉匹配为宇宙多维认知提供了关键支持。sdss_gaia_crossmatched数据集通过精密的天文测量技术,将斯隆数字巡天(SDSS)与盖亚任务(Gaia)的观测数据进行深度整合,构建过程涉及复杂的天体坐标匹配算法与多波段光谱校准。数据集采用层次化结构存储,包含41901个天体的完整观测记录,每个样本均通过严格的质控流程确保数据可靠性,最终形成包含光谱通量、天体测量参数、光度数据等多维度特征的标准化集合。
特点
该数据集最显著的特征在于其多维度的天体物理参数覆盖。不仅包含传统的测光数据(如U/G/R/I/Z波段通量及其误差),还整合了盖亚任务特有的天体测量参数(视差、自行运动)和光谱特征(径向速度、金属丰度)。数据结构设计科学,采用嵌套式特征组织方式,将天体测量、光度测量、光谱测量等模块以结构化形式呈现。特别值得注意的是,数据集包含罕见的全波段光谱系数序列和线扩散函数参数,为恒星大气模型研究提供了珍贵的一手资料。
使用方法
该数据集适用于银河系结构与演化等前沿课题研究。使用者可通过HuggingFace平台直接加载标准化数据,利用内置的HEALPix索引实现天区快速检索。对于光谱分析,建议结合spectrum结构体中的波长-流量矩阵与线扩散函数参数进行谱线拟合;天体物理参数研究则可综合运用astrometry和gspphot模块的误差关联矩阵。数据集采用Apache Arrow格式存储,支持通过PySpark或Dask进行分布式计算,特别适合处理跨波段的大规模天体物理数据分析任务。
背景与挑战
背景概述
sdss_gaia_crossmatched数据集是天文学领域中一项重要的跨项目数据整合成果,由斯隆数字巡天(SDSS)和盖亚任务(Gaia)两大天文观测项目的科研团队联合构建。该数据集的核心研究目标在于整合SDSS提供的光谱数据与Gaia的高精度天体测量数据,通过多模态数据融合解决恒星物理参数测定、银河系三维结构建模等关键科学问题。数据集的出现标志着天文学研究从单一观测手段向多信使天文学的范式转变,为研究恒星演化、银河系动力学及宇宙学参数约束提供了前所未有的多维度数据支持。
当前挑战
该数据集面临的核心挑战主要体现在两个维度:科学问题层面,如何有效融合不同波段、不同精度的异构观测数据以提升恒星参数反演精度,成为制约天体物理研究的关键瓶颈;技术构建层面,SDSS与Gaia数据在空间分辨率、观测时间基线和误差分布上的系统性差异,要求开发复杂的交叉匹配算法和误差传播模型。数据预处理过程中,消除仪器系统误差、统一不同坐标系下的天体定位、处理缺失值和异常值等问题,都对数据质量提出了严峻考验。
常用场景
经典使用场景
在天文学研究中,sdss_gaia_crossmatched数据集通过整合斯隆数字巡天(SDSS)和盖亚任务(Gaia)的多波段观测数据,为星系与恒星的天体物理特性研究提供了跨模态基准。其典型应用包括利用光谱通量、天体测量参数和光度学数据,构建恒星大气模型或验证银河系结构演化理论,尤其在分析光谱能量分布与自行运动关联性方面具有不可替代的价值。
衍生相关工作
以该数据集为基础衍生的经典工作包括《盖亚-斯隆光谱联合校准框架》等系列研究,其中基于光谱系数的恒星化学丰度反演算法已成为领域标杆。欧洲空间局发布的《银河系盘结构动力学图谱》同样依托该数据集的自行运动参数,重构了旋臂扰动模型的时间演化序列。
数据集最近研究
最新研究方向
在银河系结构与演化研究领域,sdss_gaia_crossmatched数据集通过整合斯隆数字巡天(SDSS)和盖亚任务(Gaia)的多波段观测数据,为恒星天体物理学提供了前所未有的多模态分析基础。近期研究聚焦于利用其高精度天体测量参数和光谱能量分布,探索银河系薄盘与厚盘的化学动力学特征,揭示恒星形成历史的时空演化规律。该数据集在时域天文学研究中展现出独特价值,科学家们正基于其径向速度与自行运动数据,追踪银河系卫星星系的潮汐瓦解过程,重构局部宇宙的暗物质分布轮廓。随着盖亚任务DR3数据的发布,跨巡天数据的协同分析成为热点,该数据集为研究恒星参数标定、星际消光模型优化提供了关键基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作