five

black-hole-catalog

收藏
Hugging Face2026-04-03 更新2026-04-04 收录
下载链接:
https://huggingface.co/datasets/juliensimon/black-hole-catalog
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为'黑洞目录',是一个已知黑洞系统的目录,包括来自SIMBAD天文数据库的确认黑洞、候选黑洞和X射线双星。数据集每周更新一次,包含3765个已知黑洞系统,其中3个为确认黑洞,14个为候选黑洞,3748个为X射线双星系统。数据集以表格形式存储,包含12个字段,如名称、赤经、赤纬、对象类型、黑洞类别、光谱类型、视星等、蓝星等、K波段星等、距离(秒差距)、角大小(角分)等。数据集适用于表格分类任务,可用于天文学、高能物理等领域的研究。数据集以Parquet格式存储,可通过Hugging Face的datasets库加载和使用。数据来源于斯特拉斯堡的SIMBAD天文数据库,每周一18:30 UTC通过GitHub Actions自动更新。
创建时间:
2026-03-24
原始信息汇总

数据集概述

基本信息

  • 数据集名称:Black Hole Catalog
  • 发布者:Julien Simon
  • 发布平台:Hugging Face
  • 许可证:CC-BY-4.0
  • 主要语言:英语
  • 数据格式:Parquet
  • 数据规模:小于1K条记录(n<1K)
  • 任务类别:表格分类(tabular-classification)
  • 标签:space, open-data, astronomy, black-hole, x-ray-binary, simbad, high-energy, tabular-data, parquet

数据描述

该数据集是从SIMBAD天文数据库中提取的已知黑洞系统目录,包含已确认的黑洞、候选黑洞以及拥有黑洞伴星的X射线双星系统。数据集共包含3765个系统,具体构成如下:

  • 已确认的黑洞:3
  • 候选黑洞:14
  • 拥有黑洞伴星的X射线双星系统:3748

数据每周更新一次。

数据模式(Schema)

列名 数据类型 描述
name string 主要的SIMBAD标识符
ra_deg float 赤经(度)
dec_deg float 赤纬(度)
object_type string SIMBAD类型代码(BH, BH?, XB*, HXB, LXB)
bh_category string 可读的分类标签
spectral_type string 光谱分类
v_mag float 目视星等
b_mag float 蓝色星等
k_mag float K波段(红外)星等
distance_pc float 距离(秒差距)
angular_size_arcmin float 角大小(角分)

使用方式

可以通过Hugging Face的datasets库加载数据,并转换为Pandas DataFrame进行处理。示例代码展示了如何加载数据以及筛选已确认的黑洞。

更新频率

数据每周一UTC时间18:30通过GitHub Actions自动更新。

数据来源

数据源自SIMBAD天文数据库(法国斯特拉斯堡天文数据中心)。

相关数据集

数据处理管道

源代码仓库位于:juliensimon/space-datasets

引用

建议使用提供的BibTeX条目进行引用。

搜集汇总
数据集介绍
main_image_url
构建方式
在当代天体物理学研究中,黑洞系统的编目对于理解高能天体现象至关重要。本数据集依托于斯特拉斯堡天文数据中心维护的SIMBAD天文数据库,通过自动化脚本每周进行数据抓取与更新,确保了信息的时效性与权威性。数据构建过程严格遵循天文学标准,从原始观测数据中提取了包括位置坐标、天体类型、星等及距离在内的关键参数,并以Parquet格式进行结构化存储,便于高效访问与分析。
特点
该数据集收录了3765个已知黑洞系统,涵盖已确认黑洞、候选体及包含黑洞伴星的X射线双星系统,具有高度的专业性与完整性。其数据字段设计科学,不仅包含基本的天体标识与坐标信息,还整合了多波段星等、光谱类型及距离估计等物理参数,为多维度研究提供了丰富素材。数据集采用清晰的分类体系,将天体类型编码与可读类别相结合,显著提升了数据可解释性与应用灵活性。
使用方法
研究人员可通过Hugging Face的datasets库直接加载该数据集,并利用Pandas进行进一步的数据处理与筛选。例如,可依据object_type字段快速提取已确认的黑洞样本,或按bh_category进行分布统计。数据集支持天文学、机器学习等领域的多场景应用,如黑洞候选体的分类建模、空间分布分析或与其他天文数据集进行交叉验证。其每周自动更新的机制,也确保了研究能够基于最新观测数据持续开展。
背景与挑战
背景概述
黑洞作为宇宙中最神秘的天体之一,其观测与分类一直是天体物理学研究的核心议题。Black Hole Catalog数据集由研究人员Julien Simon于2026年创建,依托斯特拉斯堡天文数据中心(CDS)的SIMBAD天文数据库,系统性地收录了已知黑洞系统的结构化信息。该数据集旨在为天文学界提供一个统一、可访问的黑洞系统编目,涵盖已确认黑洞、候选黑洞以及包含黑洞伴星的X射线双星系统,共计3765个天体。通过每周自动更新机制,该数据集不仅促进了高能天体物理领域的标准化研究,也为机器学习模型在宇宙天体分类任务中的应用提供了宝贵的数据基础。
当前挑战
在黑洞天体分类领域,首要挑战在于观测数据的稀缺性与不确定性,已确认的黑洞仅占编目中的极小部分,绝大多数为候选体或间接观测的X射线双星系统,这给模型的精确分类带来了固有困难。构建数据集过程中,面临来自SIMBAD原始数据的异构性挑战,包括天体类型编码的标准化、多波段星等数据的完整性校验,以及距离、角尺寸等物理参数的缺失值处理。此外,维持数据集的时效性与准确性需依赖自动化管道与外部数据库的同步,这对数据更新流程的稳定性提出了持续要求。
常用场景
经典使用场景
在天体物理学领域,黑洞目录数据集为研究人员提供了系统化的黑洞系统编目,其经典使用场景聚焦于对已知黑洞、候选体及X射线双星的分类与统计分析。通过整合SIMBAD天文数据库的权威数据,该数据集支持天文学家对黑洞的物理特性进行探索,例如依据光谱类型、视星等和距离参数,对黑洞系统的演化阶段与分布规律进行深入建模,从而揭示高能天体物理过程的本质。
解决学术问题
该数据集有效解决了天体物理学中关于黑洞识别与分类的核心学术问题。通过提供标准化的黑洞系统分类(如确认黑洞、候选黑洞及X射线双星),研究人员能够基于多波段观测数据(如可见光、蓝光与红外波段)进行系统性分析,从而推动对黑洞形成机制、质量分布及其与伴星相互作用的深入研究。其意义在于为理论模型提供了实证基础,促进了高能天体物理与宇宙学领域的知识积累。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,例如结合引力波事件数据集,开展黑洞合并事件的电磁对应体搜寻;或与类星体目录集成,研究超大质量黑洞与活动星系核的关联性。此外,基于该数据集的分类特征,研究人员开发了新的统计模型,用于预测X射线双星的光变行为,这些工作显著拓展了黑洞天体物理学的多信使研究范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作