tess-toi-candidates
收藏Hugging Face2026-04-02 更新2026-04-03 收录
下载链接:
https://huggingface.co/datasets/juliensimon/tess-toi-candidates
下载链接
链接失效反馈官方服务:
资源简介:
TESS Objects of Interest (TOI) Planet Candidates 数据集包含了由NASA的TESS(Transiting Exoplanet Survey Satellite)任务识别的行星候选体。TESS是一颗于2018年发射的太空望远镜,用于全天巡天寻找凌日系外行星。当恒星显示出与行星在其前方经过一致的周期性亮度下降时,它会被标记为TESS关注对象(TOI)。每个TOI都会经过后续观测以确定其是否为真正的行星、假阳性(如食双星)或仍为活跃候选体。数据集包含7,913个TOI条目,其中包括719个已确认行星(CP)、1,237个假阳性(FP)和7,401个具有半径估计的候选体。数据集以表格形式存储,包含诸如TOI编号、行星名称、赤经、赤纬、轨道周期、行星半径、平衡温度、凌日深度、宿主星的TESS星等和TFOPWG处置状态(CP/FP/KP/PC)等字段。该数据集对于系外行星人口统计、大气表征目标选择、径向速度观测计划以及自动凌日筛选的机器学习分类器训练具有重要价值。数据集每周更新一次,数据来源于NASA Exoplanet Archive的TESS TOI目录。
创建时间:
2026-03-25
原始信息汇总
TESS Objects of Interest (TOI) Planet Candidates 数据集概述
数据集基本信息
- 数据集名称:TESS Objects of Interest (TOI) Planet Candidates
- 发布者:Julien Simon
- 发布日期:2026年
- 许可协议:CC-BY-4.0
- 语言:英语
- 数据格式:Parquet
- 数据规模:1K<n<10K
- 任务类别:表格分类
- 标签:空间、系外行星、tess、行星候选体、凌星、nasa、开放数据、表格数据
数据集描述
该数据集包含由NASA的凌星系外行星巡天卫星任务识别的行星候选体,源自NASA系外行星档案TOI目录。数据每周更新。
TESS是一颗于2018年发射的NASA空间望远镜,对整个天空进行巡天以寻找凌星系外行星。当一颗恒星显示出与行星从其前方经过相一致的周期性亮度下降时,它被标记为TESS关注对象。每个TOI都会经过后续观测,以确定其是真正的行星、假阳性还是活跃的候选体。
该目录对于系外行星人口统计学至关重要,能够进行发生率计算,并作为选择大气表征目标、规划径向速度活动以及训练机器学习分类器的主要资源。
数据内容与结构
- 总条目数:7,913个TOI条目
- 已确认行星:719个
- 假阳性:1,237个
- 具有半径估计值的条目:7,401个
数据模式
| 列名 | 类型 | 描述 |
|---|---|---|
toi_id |
float64 | TESS输入目录ID |
toi_prefix |
float64 | TOI编号 |
planet_name |
string | 已确认的行星名称 |
ra_deg |
float64 | 赤经 |
dec_deg |
float64 | 赤纬 |
period_days |
float64 | 轨道周期 |
radius_earth |
float64 | 行星半径 |
equilibrium_temp_k |
float64 | 平衡温度 |
transit_depth_ppm |
float64 | 凌星深度 |
tmag |
float64 | 宿主星的TESS星等 |
disposition |
string | TFOPWG处置状态 |
数据来源与更新
- 数据源:NASA系外行星档案,TESS TOI目录,通过TAP服务访问。
- 更新频率:每周一17:00 UTC更新。
- 更新方式:通过GitHub Actions自动更新。
使用方式
数据集可通过Hugging Face datasets库加载,并转换为Pandas DataFrame进行分析。示例代码包括筛选已确认行星、小型岩石行星以及绘制轨道周期分布图。
相关数据集
- neo-close-approaches -- NEO Close Approaches
- pulsar-catalog -- ATNF Pulsar Catalogue
项目与支持
- 源代码仓库:https://github.com/juliensimon/space-datasets
- 支持方式:在数据集页面点赞或在Community标签页分享反馈。
搜集汇总
数据集介绍

构建方式
在系外行星探测领域,TESS TOI候选体数据集源自NASA凌星系外行星巡天卫星的观测成果。该数据集通过自动化管道从NASA系外行星档案的TESS TOI目录中提取,每周定期更新,确保数据的时效性。构建过程中,凌星信号经初步筛选后被标记为TESS关注目标,随后由TESS后续观测计划工作组根据多波段观测数据,为每个目标分配明确的分类状态,如已确认行星、假阳性或活跃候选体。数据以结构化表格形式存储,涵盖目标标识、轨道参数、物理属性及分类状态等关键字段,为后续科学研究提供标准化基础。
特点
该数据集收录了近八千个TESS关注目标,涵盖已确认行星、假阳性及活跃候选体等多种分类,全面反映了TESS巡天的探测成果。其核心特征在于采用每周更新的动态机制,紧密追踪TESS延展任务的新发现,确保数据的前沿性。数据集特别优化了对明亮近距恒星的探测,使得其中包含的行星候选体更易于地面望远镜进行后续观测,如径向速度质量测量和大气光谱表征。此外,数据集中丰富的物理参数,如行星半径、平衡温度和凌星深度,为研究行星形成理论、计算出现率及筛选大气特征观测目标提供了多维度信息支撑。
使用方法
利用该数据集时,研究者可通过Hugging Face的datasets库直接加载,并转换为Pandas DataFrame进行灵活分析。典型应用包括按分类状态筛选数据以聚焦已确认行星或特定候选体群体,或根据行星半径、轨道周期等物理参数划定科学样本,例如提取潜在宜居带内的类地行星候选。数据集支持进行人口统计研究,如绘制轨道周期分布直方图,以揭示TESS探测的偏置特性。其结构化设计也便于与机器学习流程集成,用于训练自动化凌星信号分类模型或作为行星属性预测任务的基准数据。
背景与挑战
背景概述
TESS Objects of Interest (TOI) Planet Candidates 数据集由美国国家航空航天局(NASA)的凌星系外行星巡天卫星(TESS)任务所生成,该任务于2018年发射,旨在通过凌星法系统性地搜寻太阳系外行星。数据集的核心研究问题聚焦于识别、分类和验证TESS观测到的行星候选体,以推动系外行星的发现、统计特征分析及后续表征研究。作为TESS科学数据管道的主要输出,TOI目录每周更新,汇集了包括已确认行星、假阳性信号及活跃候选体在内的近八千个条目,由TESS后续观测计划工作组负责分类标注。这一数据集不仅延续了开普勒任务的科学遗产,更通过其全天空巡天策略,优化了对邻近明亮恒星周围行星的探测,极大地促进了地面径向速度测量、詹姆斯·韦伯空间望远镜的大气表征等后续观测,已成为系外行星人口统计学和机器学习自动分类模型训练的关键资源。
当前挑战
该数据集所应对的领域挑战在于系外行星探测中的信号验证与分类难题。凌星观测中,行星候选信号常与食双星、恒星活动等假阳性现象混淆,需通过多波段后续观测进行甄别,这一过程耗时且依赖大量观测资源。同时,从海量光度曲线中高效筛选出真实行星信号,尤其对于小半径、长周期等微弱信号,对检测算法的灵敏度与鲁棒性提出了极高要求。在数据构建层面,挑战体现在异构天文数据的整合与标准化。TESS原始数据需经过复杂的光度提取、噪声滤除及周期搜索流程,而TOI目录的生成涉及多源数据(如TESS输入星表、后续观测报告)的融合,确保天体坐标、行星参数等字段的准确性与一致性。此外,数据集需维持每周更新的动态性,以纳入新观测扇区的候选体,这对自动化数据流水线的可靠性构成了持续考验。
常用场景
经典使用场景
在系外行星探测领域,TESS TOI候选体数据集为天文学家提供了关键的数据资源。该数据集最经典的使用场景是支持系外行星的发现与确认流程,研究人员利用其中的轨道周期、行星半径、凌星深度等参数,结合机器学习算法对候选体进行分类,区分已确认行星、假阳性信号和待定候选体,从而高效筛选出具有科学价值的目标进行后续观测。
解决学术问题
该数据集有效解决了系外行星统计研究中的核心问题,特别是行星出现率的计算。通过提供大量围绕明亮恒星的行星候选体样本,它弥补了开普勒任务在观测策略上的局限,使学者能够分析不同恒星类型和轨道周期范围内的行星分布规律,进而深化对行星形成与演化机制的理解,推动系外行星人口统计学的发展。
衍生相关工作
该数据集衍生了一系列经典研究工作,例如基于机器学习的凌星信号自动验证模型,这些模型利用TOI的标注数据训练分类器,以识别虚假信号。此外,许多研究利用该数据集筛选出宜居带内的类地行星候选体,并策划了大规模的多波段后续观测项目,为系外行星科学的多个前沿方向提供了数据支撑。
以上内容由遇见数据集搜集并总结生成



