nasa-mars-rover-images
收藏Hugging Face2026-04-13 更新2026-04-14 收录
下载链接:
https://huggingface.co/datasets/juliensimon/nasa-mars-rover-images
下载链接
链接失效反馈官方服务:
资源简介:
NASA火星探测器图像目录数据集包含了由毅力号(Mars 2020)和好奇号(MSL)火星探测器在火星表面拍摄的每张原始图像的元数据。毅力号自2021年2月起在Jezero陨石坑探索古代河流三角洲,寻找过去微生物生命的迹象,并缓存样本以备将来返回地球。好奇号自2012年8月起在Gale陨石坑攀登Sharp山,发现了火星曾经拥有适合生命存在的长期湖泊和河流的证据。这些探测器使用多种相机拍摄了超过200万张原始图像,包括用于导航和避障的工程相机、用于地质调查的科学相机以及SuperCam和Mastcam-Z等专用仪器。该元数据目录包括图像时间戳、火星日数、相机仪器、探测器位置(XYZ站点框架)、指向角度和下载URL,支持对成像模式、轨迹映射和目标图像检索的大规模分析,而无需下载数TB的原始图像数据。数据集适用于表格分类任务。数据集总共有405,876张图像,其中毅力号和好奇号各占202,938张,涵盖了11种相机仪器。数据以Parquet格式存储,每周一11:00 UTC更新。
创建时间:
2026-04-09
原始信息汇总
NASA Mars Rover Image Catalog 数据集概述
数据集基本信息
- 数据集名称: NASA Mars Rover Image Catalog
- 发布者: juliensimon
- 许可证: CC-BY-4.0
- 语言: 英语 (en)
- 任务类别: 表格分类 (tabular-classification)
- 数据规模: 100K<n<1M
- 数据格式: Parquet
- 数据文件:
data/mars_rover_images.parquet(仅包含训练集)
数据集描述
该数据集包含了由毅力号(Mars 2020)和好奇号(MSL)火星车在火星表面拍摄的每一张原始图像的元数据。毅力号自2021年2月起探索Jezero陨石坑,调查古老的河流三角洲以寻找过去微生物生命的迹象,并缓存样本以备未来返回地球。好奇号自2012年8月起攀登盖尔陨石坑的夏普山,发现了火星曾经拥有适合生命存在的长期湖泊和河流的证据。这些火星车使用多种相机(用于导航和危险规避的工程相机、用于地质调查的科学相机以及SuperCam和Mastcam-Z等专用仪器)共同拍摄了超过200万张原始图像。此元数据目录包含图像时间戳、火星日编号、相机仪器、火星车位置(XYZ站点坐标系)、指向角度和下载URL,支持对成像模式、行进轨迹映射和目标图像检索进行大规模分析,而无需下载数TB的原始图像数据。
数据统计
- 图像总数: 405,876
- 毅力号图像: 202,938 (截至火星日 4,864)
- 好奇号图像: 202,938 (截至火星日 4,864)
- 相机仪器数量: 11
数据模式 (Schema)
| 列名 | 类型 | 描述 | 空值率 |
|---|---|---|---|
id |
Int64 | NASA分配的唯一整数图像ID;每个任务内单调递增 | 0.0% |
mission |
str | 任务标识符:"mars2020"(毅力号,Jezero陨石坑,着陆于2021年2月18日)或 "msl"(好奇号,Gale陨石坑,着陆于2012年8月6日) | 0.0% |
sol |
Int64 | 自火星车着陆以来的火星太阳日(火星日0 = 着陆日期,每个火星日约1.0275个地球日) | 0.0% |
instrument |
str | 相机仪器名称(例如:"FRONT_HAZCAM_LEFT_A", "NAVCAM_LEFT", "MCZ_RIGHT", "MASTCAM_LEFT";极少为空) | 0.0% |
date_taken |
str | 图像在火星上拍摄的UTC日期时间 | 0.0% |
date_received |
str | 图像通过深空网络在地球上接收的UTC日期时间 | 0.0% |
site |
Int64 | 沿火星车行进路线的地形站点索引;当火星车行驶到新位置时递增 | 49.4% |
drive |
Int64 | 站点内的行驶序列号;跟踪单独的行驶会话 | 49.4% |
rover_x |
float64 | 火星车在本地站点坐标系中的X位置(米);坐标原点位于站点建立点 | 49.4% |
rover_y |
float64 | 火星车在本地站点坐标系中的Y位置(米) | 49.4% |
rover_z |
float64 | 火星车在本地站点坐标系中的Z位置(米);在平坦地形上通常接近零 | 49.4% |
mast_azimuth |
float64 | 遥感桅杆方位角,单位为度(0-360,从北顺时针) | 49.4% |
mast_elevation |
float64 | 遥感桅杆俯仰角,单位为度;正数 = 地平线以上,负数 = 地平线以下 | 49.4% |
sample_type |
str | 图像采样模式:"full"(全分辨率)、"subframe"(裁剪区域)、"thumbnail"(降分辨率预览) | 0.0% |
local_mean_solar_time |
str | 图像拍摄时的本地平均太阳时(格式 "sol HH:MM:SS");近似太阳在天空中的位置 | 49.4% |
image_url |
str | 从NASA火星原始图像服务器下载原始图像的HTTPS直接URL | 0.0% |
is_thumbnail |
bool | 如果此行代表缩略图图像(较低分辨率预览)则为True,完整/子帧图像则为False | 0.0% |
title |
str | 由仪器、火星日和序列标识符组成的人类可读图像标题;可能为空 | 0.0% |
数据源与更新
- 数据源: https://mars.nasa.gov/raw_images/
- 更新频率: 每周(UTC时间周一11:00)通过GitHub Actions更新。增量更新仅获取自上次运行以来添加的图像。
相关数据集
- https://huggingface.co/datasets/juliensimon/esa-exomars-tgo-observations
- https://huggingface.co/datasets/juliensimon/esa-mars-express-observations
- https://huggingface.co/datasets/juliensimon/mars-craters-robbins
- https://huggingface.co/datasets/juliensimon/mars-perseverance-weather
- https://huggingface.co/datasets/juliensimon/mars-chemcam-compositions
引用
bibtex @dataset{nasa_mars_rover_images, title = {NASA Mars Rover Image Catalog}, author = {juliensimon}, year = {2026}, url = {https://huggingface.co/datasets/juliensimon/nasa-mars-rover-images}, publisher = {Hugging Face} }
搜集汇总
数据集介绍

构建方式
在行星科学领域,NASA火星漫游车图像目录的构建体现了对大规模空间探测数据的高效整合。该数据集通过自动化流程,每周从NASA火星原始图像服务器同步获取毅力号和好奇号漫游车拍摄的原始图像元数据,涵盖图像ID、拍摄时间、相机仪器、漫游车位置及指向角度等关键字段。数据以Parquet格式存储,采用增量更新机制,仅获取自上次运行以来新增的图像记录,确保了数据集的时效性与完整性,同时避免了直接下载海量原始图像数据的存储负担。
使用方法
利用该数据集进行科学研究时,用户可通过Hugging Face的datasets库便捷加载数据,并转换为Pandas DataFrame以进行灵活的数据操作。典型应用包括按任务或相机仪器筛选图像,例如提取好奇号桅杆相机的所有记录,或分析毅力号每日成像数量的变化趋势。结合漫游车位置数据,可进一步可视化其行进轨迹,探索特定地点与成像活动的关系。数据集适用于表格分类任务,为机器学习模型训练提供了丰富的结构化特征,助力于自动化图像分类或探测模式识别等高级分析。
背景与挑战
背景概述
NASA火星探测器图像目录数据集由Julien Simon于2026年整理发布,旨在系统化归档美国宇航局‘毅力号’与‘好奇号’火星探测器所捕获的原始图像元数据。该数据集聚焦于行星地质学与天体生物学领域,核心研究问题在于通过长期、连续的图像记录,解析火星地表环境演化历史,并搜寻远古生命存在的潜在证据。自‘好奇号’2012年登陆盖尔陨石坑及‘毅力号’2021年探索杰泽罗陨石坑以来,两辆探测器累计拍摄逾两百万张图像,其元数据涵盖时间戳、探测器位姿、相机参数等关键信息,为全球科研人员提供了大规模分析火星地表特征、探测器行进轨迹及成像模式的数据基础,显著推动了深空探测任务的开放科学进程。
当前挑战
该数据集所应对的领域挑战在于如何从海量、异构的火星图像中高效提取地质特征与环境线索,以支持火星宜居性评估及样本返回任务的科学目标。具体而言,图像分类任务需克服火星地表光照条件多变、地形纹理复杂及尘埃干扰等因素导致的特征识别困难。在数据集构建层面,挑战主要体现为多源异构数据的整合与标准化,包括不同探测器相机系统的参数差异、元数据字段缺失率较高(如位姿数据缺失约49.4%),以及每周增量更新机制下数据一致性与完整性的维护。此外,原始图像数据规模达太字节级别,如何通过元数据目录实现轻量化访问与精准检索,亦是工程实践中的关键难题。
常用场景
解决学术问题
该数据集解决了火星探测中影像数据管理与高效利用的学术挑战。传统上,海量原始图像直接下载需消耗巨大存储与计算资源,而本数据集通过结构化元数据,使研究者能够在不获取完整图像的前提下,进行遍历路径重建、相机指向模式统计及任务规划分析。这显著提升了火星表面成像数据的可访问性,为研究火星气候历史、水文痕迹及潜在宜居性提供了关键数据基础,推动了行星科学的数据驱动研究范式。
实际应用
在实际工程与任务支持领域,该数据集被广泛应用于火星漫游车的任务规划与导航优化。任务团队可通过分析历次拍摄的仪器使用频率、位置坐标及时间序列,评估相机系统的工作状态与成像效率,从而优化后续探测路径与科学目标优先级。此外,教育机构与科普平台利用数据集中的图像元数据,开发交互式火星探索工具,帮助公众直观理解漫游车的日常活动与科学发现,增强太空探索的社会影响力。
数据集最近研究
最新研究方向
在行星科学领域,NASA火星车图像目录作为关键数据源,正推动着基于元数据的智能分析范式。前沿研究聚焦于利用机器学习算法对图像元数据进行自动分类与模式识别,以优化火星地质特征的探测效率。结合毅力号与好奇号长期积累的时空坐标与相机参数,学者们致力于构建火星表面环境变化的动态模型,辅助寻找远古生命迹象。这一数据集的热点应用体现在支持自主导航系统的开发,以及为样本返回任务提供视觉决策依据,其开放访问特性显著降低了行星遥感研究的门槛,促进了跨学科协作的深化。
以上内容由遇见数据集搜集并总结生成



