jwst-observations
收藏Hugging Face2026-04-27 更新2026-04-28 收录
下载链接:
https://huggingface.co/datasets/juliensimon/jwst-observations
下载链接
链接失效反馈官方服务:
资源简介:
JWST观测目录是一个完整的索引,记录了NASA/ESA/CSA的詹姆斯·韦伯太空望远镜(JWST)从Mikulski太空望远镜档案(MAST)中获取的每一次观测数据。数据集中的每一行代表一次JWST观测,包括观测的提案信息、目标信息、仪器和观测模式、时间信息、波长覆盖范围、使用的滤波器、CAOM数据产品类型以及最高校准级别。该数据集适用于回答诸如“JWST在给定RA/Dec附近观测了什么?”、“哪些提案使用了MIRI日冕仪?”、“特定目标的总曝光时间是多少?”等问题。数据集规模包括971,726次JWST观测,其中886,417次为科学观测,85,309次为校准观测,涉及2,002个不同的提案,总曝光时间为626,503小时。数据每周更新一次,适用于表格分类任务。
The JWST Observation Catalog is a comprehensive index documenting every observation data obtained by NASA/ESA/CSAs James Webb Space Telescope (JWST) from the Mikulski Archive for Space Telescopes (MAST). Each row in the dataset represents a JWST observation, including proposal information (proposal ID, PI, title, category), target information (name, coordinates, type, moving/fixed flag, redshift), instrument and observation mode (imaging, slit/slitless spectroscopy, integral field, coronagraphy), time information (start/end MJD and ISO dates, total exposure time), wavelength coverage (microns), filters used, CAOM data product type, and highest calibration level. The dataset is suitable for answering questions such as What did JWST observe near a given RA/Dec?, Which proposals used the MIRI coronagraph?, and What is the total exposure time for a specific target?. It is designed for cross-matching with target catalogs (quasars, exoplanets, galaxies, solar system objects), for project-level summaries, and for planning cross-facility follow-up observations. The dataset includes 971,726 JWST observations, with 886,417 being scientific observations and 85,309 being calibration observations, involving 2,002 different proposals, totaling 626,503 hours of exposure time. The data is updated weekly and is suitable for tabular classification tasks.
创建时间:
2026-04-18
原始信息汇总
JWST 观测目录数据集概述
基本描述
JWST 观测目录是一个完整的索引,记录了 NASA/ESA/CSA 詹姆斯·韦伯太空望远镜(JWST)的所有观测数据。数据来源于 Mikulski 空间望远镜档案馆(MAST)。JWST 于 2021 年 12 月 25 日发射,2022 年中期完成调试,是迄今为止最强大的红外空间天文台。
数据集规模
- 总观测次数:971,726 条
- 科学观测:886,417 条
- 校准观测:85,309 条
- 独立提案:2,002 个
- 总曝光时长:626,503 小时
- 时间范围:2022-01-28 至 2026-04-27
数据模式
数据集表格包含 24 个字段,关键字段包括:
| 字段 | 类型 | 说明 |
|---|---|---|
obs_id |
字符串 | MAST 观测标识符,主键 |
obstype |
字符串 | CAOM 观测类型(S 简单 / C 复合) |
intent |
字符串 | 观测意图(science / calibration) |
proposal_id |
字符串 | JWST 提案标识符 |
proposal_pi |
字符串 | 提案首席研究员姓名 |
proposal_title |
字符串 | 观测提案全称 |
proposal_project |
字符串 | 提案项目代码(GO、GTO、ERS、DDT) |
target_name |
字符串 | 目标名称 |
target_ra |
浮点数 | 目标赤经(十进制角度) |
target_dec |
浮点数 | 目标赤纬(十进制角度) |
target_moving |
布尔值 | 是否为移动目标 |
observation_start_mjd |
浮点数 | 观测开始时间(修正儒略日) |
observation_end_mjd |
浮点数 | 观测结束时间(修正儒略日) |
total_exposure_sec |
浮点数 | 总曝光时间(秒) |
wavelength_min_meters |
浮点数 | 最小波长覆盖(米) |
wavelength_max_meters |
浮点数 | 最大波长覆盖(米) |
filters |
字符串 | 使用的滤镜名称(分号分隔) |
dataproduct_types |
字符串 | CAOM 数据类型(image、spectrum、cube、measurements) |
max_calibration_level |
整数 | 最高校准等级(0-4) |
plane_count |
整数 | 不同校准等级的数据产品数量 |
earliest_release_date |
字符串 | 最早公开日期(ISO-8601) |
instrument |
字符串 | 仪器名称(NIRCAM、NIRSPEC、NIRISS、MIRI、FGS) |
observation_mode |
字符串 | 观测模式(IMAGE、SPECTRUM、IFU、SLIT、WFSS、TACQ) |
observation_start_date |
字符串 | 观测开始时间(ISO-8601 UTC) |
observation_end_date |
字符串 | 观测结束时间(ISO-8601 UTC) |
适用任务
- 表格分类任务
- 交叉匹配目标目录(类星体、系外行星、星系、太阳系天体)
- 项目级汇总分析
- 跨设施后续观测规划
- 回答诸如:特定位置附近 JWST 观测了什么?哪些提案使用了 MIRI 日冕仪?特定目标上花费了多少曝光时间?专属访问数据何时公开?
数据来源与更新
- 数据来源:MAST 的 CAOM 表(
dbo.caomobservation与dbo.caomplane关联) - 更新频率:每周一 13:00 UTC 更新一次
许可证
- 许可协议:CC-BY-4.0
- 数据集提供者:Julien Simon
搜集汇总
数据集介绍

构建方式
詹姆斯·韦伯空间望远镜(JWST)作为人类迄今最强大的红外天文台,其每次观测都蕴含着宇宙深处的奥秘。该数据集完整收录了自JWST发射以来由MAST档案整理的每一次观测记录,数据源来自CAOM模型中的'caomobservation'与'caomplane'表格的关联查询。每一行代表一次独立的望远镜观测单元,涵盖了提案信息(如PI、标题、项目类别)、目标属性(坐标、类型、红移)、仪器与观测模式(成像、光谱、日冕仪等)、时间参数(起止时间、总曝光时长)、波长覆盖范围、滤光片使用情况以及数据产品类型与校准等级。数据集每周自动刷新,确保与MAST档案同步更新。
特点
该数据集拥有近百万条观测记录,涵盖超过两千个科学提案,总曝光时长超过六十万小时,时间跨度从2022年初至2026年。其特色在于多维度的元数据标注:从'proposal_keywords'到'earliest_release_date',既能精确检索特定天区附近的全天观测,又可按仪器、模式、目标类型进行筛选。'intent'字段区分科学与校准观测,'target_moving'标记太阳系小天体,为系外行星、星系、类星体等不同研究领域提供了统一的交叉匹配基础。数据以Parquet格式高效存储,缺失率极低,保证了大规模分析的可靠性。
使用方法
用户可通过Hugging Face的datasets库便捷加载数据,以一行代码即可将完整目录读入Pandas DataFrame进行分析。丰富的模式设计使其天然适用于分类任务与统计可视化:例如,可快速筛选特定仪器在目标天区附近的成像观测,或按时间序列绘制各仪器使用频率的演化图。借助RA和Dec坐标列,还能轻松开展全天目标分布的可视化呈现,为跨设施后随观测的计划制定提供关键支持。此外,数据集支持与Chandra、eROSITA等其他空间望远镜目录的联合分析,构建从高能射线到红外波段的统一星表视图。
背景与挑战
背景概述
詹姆斯·韦伯空间望远镜(JWST)于2021年12月发射,作为人类历史上最强大的红外天基天文台,其观测数据对天文学研究具有革命性意义。由Julien Simon创建的JWST观测目录(JWST Observation Catalog)是一个完整索引,记录了自2022年1月以来JWST获取的每一次观测,数据源自Mikulski空间望远镜档案馆(MAST)。该数据集收录了超过97万条观测记录,涵盖NIRCam、NIRSpec等四种科学仪器的观测模式,以统一表格形式呈现提案信息、目标属性、时间覆盖及波谱范围等关键内容。作为跨设施观测规划与多波段交叉匹配的基础资源,该目录与Chandra、eROSITA等太空望远镜数据集协同,为高能至红外波段的天文研究提供了标准化视图,显著推动了系外行星、星系演化及太阳系天体等领域的科学探索。
当前挑战
该数据集的核心挑战在于应对JWST观测数据的高维度与异质性,包括从原始遥测到科学可用产品的多级校准(0至4级),以及91个字段的复杂模式,需精确处理目标坐标缺失(如移动天体)、空值分布不均(如提案关键词93.9%为空)等数据质量问题。构建过程中,需从MAST的CAOM数据库关联两个主体表(dbo.caomobservation与dbo.caomplane),每周自动更新流水线产物,确保校准与工程观测被准确标注。此外,天文学领域面临观测数据标准化困难:不同仪器(如MIRI、NIRSpec)的观测模式涵盖成像、光谱、积分场及日冕仪,需在单一目录中统一波长范围(0.6至8.77微米)与滤波器名称,同时保持与外部星表(如类星体、系外行星)的交叉匹配能力,这对数据精度与更新时效性提出了双重考验。
常用场景
经典使用场景
JWST观测目录数据集作为詹姆斯·韦伯空间望远镜所有科学观测的完整索引,其经典应用场景在于多维度数据检索与分析。研究者可基于该数据集快速查询特定天区内的观测记录,筛选特定仪器(如NIRCam、MIRI)和观测模式(成像、光谱、积分场)的数据,并获取曝光时长、波长覆盖范围与校准等级等关键信息。通过锥形检索实现与目标星表的交叉匹配,该数据集为系外行星、星系、类星体及太阳系天体的多波段研究提供了统一入口。此外,科研人员可借助时间序列分析追踪望远镜观测的时空分布规律,或利用计划类别(GO、GTO、ERS)字段评估不同科学项目的优先级与产出效率。
实际应用
在实际应用中,该数据集已成为跨设施协同观测的枢纽型工具。天文台科学家利用其规划地面与空间望远镜的联合观测窗口,例如协调阿塔卡马大型毫米波阵列(ALMA)与JWST对同一星暴星系的中红外-亚毫米波接力观测。公共教育领域,该数据集被用于构建交互式星图,向公众可视化展示韦伯望远镜的巡天覆盖范围与科学主题分布。对于数据科学社区,其每周更新的特性支持构建实时预警系统,当特定天区的观测数据从专属转为公开时,自动通知相关社群。此外,深空探测任务的设计者利用曝光时长与校准等级指标,评估JWST对特定天体(如奥尔特云天体)的探测极限。
衍生相关工作
该数据集直接催生了一系列衍生工作,包括基于其制作的JWST观测统计年鉴,系统总结了望远镜服役初期的观测偏好与科学产出分布。研究人员开发了专用Python工具包,利用该数据集实现自动化的锥形搜索与仪器模式过滤,并与其他波段星表(如Chandra X射线源目录)共享数据接口,形成多波段天文数据联合分析框架。在教学领域,该数据集被整合进慕课平台的天文学课程中,作为学生实践表格分类、时间序列分析与空间点模式分析的典型案例。另有工作基于其时间戳信息,结合机器学习模型预测观测安排的优先级与冲突概率,优化了未来观测的调度策略。
以上内容由遇见数据集搜集并总结生成



