space-missions
收藏Hugging Face2026-04-02 更新2026-04-03 收录
下载链接:
https://huggingface.co/datasets/juliensimon/space-missions
下载链接
链接失效反馈官方服务:
资源简介:
Space Missions Database 是一个全面的空间任务数据库,包含从太空时代开始至今的载人和无人航天飞行任务,共计25,137个任务。该数据集基于Wikidata的结构化知识库构建,主要包含三类实体:空间任务(Q2133344)、载人航天飞行(Q1248784)和无人航天飞行(Q12795915)。数据由WikiProject Spaceflight社区维护,并随着新任务的执行和记录而更新。数据集采用表格形式存储,主要字段包括Wikidata实体ID(wikidata_id)、任务名称(name)和运营机构(operator,覆盖率约13%)。当Wikidata的覆盖率超过5%时,还会包含其他字段如发射日期(launch_date)和目的地(destination)等。数据集适用于表格分类任务,更新频率为季度更新(1月、4月、7月、10月)。数据以Parquet格式存储,采用CC0-1.0许可证。
创建时间:
2026-03-31
原始信息汇总
Space Missions Database 数据集概述
数据集基本信息
- 数据集名称:Space Missions Database
- 数据集标识:
juliensimon/space-missions - 许可证:CC0-1.0
- 主要语言:英语
- 数据格式:Parquet
- 数据规模:10K<n<100K
- 任务类别:表格分类
- 标签:space, missions, spaceflight, wikidata, open-data, tabular-data, parquet
数据集描述
这是一个从Wikidata获取的综合性航天任务数据库。数据库包含25,137项任务,涵盖了从航天时代初期至今的载人与非载人航天飞行。
数据来源与构成
- 数据源:Wikidata SPARQL端点。
- 实体类型:基于三类Wikidata实体构建:航天任务、载人航天飞行、非载人航天飞行。
- 维护方:由WikiProject Spaceflight社区维护,并随着新任务的执行和记录而更新。
- 数据覆盖说明:Wikidata的数据覆盖不均衡,大多数条目仅包含名称和Wikidata ID。在数据处理管道中,数据覆盖率低于5%的列会被自动丢弃。
数据模式
基础列结构如下:
| 列名 | 类型 | 描述 |
|---|---|---|
wikidata_id |
string | Wikidata实体ID |
name |
string | 任务名称 |
operator |
string | 运营机构或组织(覆盖率约13%) |
当Wikidata中相关数据覆盖率超过5%时,会出现其他列(如发射日期、目的地等)。
关键统计
- 任务总数:25,137
- 主要运营机构示例:
- 美国国家航空航天局
- 阿拉斯加交通与公共设施部
- 印度机场管理局
- 苏联太空计划
- 俄罗斯国家航天集团公司
使用方式
可通过Hugging Face datasets库加载:
python
from datasets import load_dataset
ds = load_dataset("juliensimon/space-missions", split="train")
更新计划
按季度更新(一月、四月、七月、十月)。
相关数据集
- astronaut-database:所有进入太空的人员数据库。
- launch-log:McDowell轨道发射日志。
- spacecraft-database:航天器目录。
- deep-space-probes:深空探测器轨迹数据。
数据处理管道
源代码位于:https://github.com/juliensimon/space-datasets
引用格式
bibtex @dataset{space_missions, author = {Simon, Julien}, title = {Space Missions Database}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/juliensimon/space-missions}, note = {Sourced from Wikidata (CC0)} }
搜集汇总
数据集介绍

构建方式
在航天数据科学领域,构建一个全面且可靠的任务数据库对于历史分析和趋势预测至关重要。Space Missions Database 通过从 Wikidata 的结构化知识库中提取数据而构建,其基础是三个核心实体类型:空间任务(Q2133344)、载人航天飞行(Q1248784)和非载人航天飞行(Q12795915)。数据由 WikiProject Spaceflight 社区持续维护和更新,确保了从太空时代初期至今的任务记录能够与时俱进。数据处理流程中,系统会自动舍弃数据覆盖率低于5%的列,从而在保证数据质量的同时,聚焦于信息较为完整的属性。
使用方法
对于研究人员和数据分析师而言,利用该数据集进行探索性分析是一个直接的过程。通过 Hugging Face 的 `datasets` 库加载数据后,可以便捷地将其转换为 Pandas DataFrame 进行后续操作。典型的使用场景包括按运营机构对任务进行统计排序,或者快速浏览任务名称与其对应的 Wikidata ID。数据集以 Parquet 格式存储,兼顾了存储效率与读取性能,并遵循季度更新机制,确保了分析结果能够基于最新的社区贡献数据。
背景与挑战
背景概述
随着航天技术的飞速发展,系统性地记录和分析航天任务数据成为空间科学与工程领域的重要需求。Space Missions Database由Julien Simon于2026年发布,作为轨道力学数据集系列的一部分,该数据集依托维基数据(Wikidata)的结构化知识库,整合了自航天时代开启以来总计25,137次载人与无人航天任务信息。其核心研究问题在于构建一个全面、可访问的航天任务数据库,以支持航天历史分析、任务模式挖掘及多源数据关联研究,为航天政策制定、技术演进评估及科普教育提供了关键的数据基础设施。
当前挑战
该数据集旨在解决航天任务信息整合与标准化这一领域挑战,具体包括如何从异构、动态更新的社区编纂数据源中提取可靠的结构化信息,并克服维基数据覆盖不均的问题——多数条目仅包含名称与ID,关键属性如发射日期、操作机构等数据完整度较低。在构建过程中,面临的主要挑战涉及数据清洗与质量保障,例如自动剔除覆盖率低于5%的列以维持数据集可用性,同时需在季度更新中保持与WikiProject Spaceflight社区编纂进度同步,确保数据的时效性与一致性。
常用场景
经典使用场景
在航天工程与历史研究领域,Space Missions Database作为一项全面的结构化知识资源,其经典使用场景聚焦于航天任务的多维度分析。研究者常利用该数据集进行航天任务的时间序列挖掘,例如通过launch_date字段追踪航天活动的历史演变趋势,或结合operator字段分析不同国家或机构的航天活动分布。这类分析不仅揭示了航天发展的宏观格局,也为航天政策与战略规划提供了数据支撑。
解决学术问题
该数据集有效解决了航天史学与航天系统工程中的若干关键学术问题。通过整合超过2.5万条航天任务记录,它弥补了传统航天史料分散、非结构化的缺陷,使得大规模定量研究成为可能。学者能够借此探究航天任务的成功率与影响因素、航天技术的扩散路径,以及载人航天与无人探测任务的历史演进规律,从而深化对航天活动社会技术系统的理解。
实际应用
在实际应用层面,Space Missions Database为航天产业分析、科技政策制定与科普教育提供了坚实的数据基础。商业航天公司可借此进行市场格局与竞争态势分析;政府部门能够评估国家航天能力与发展轨迹;教育机构则可利用其开发交互式教学工具,生动展示航天探索历程。这些应用将抽象的航天历史转化为可操作的知识资产。
数据集最近研究
最新研究方向
随着航天数据开放获取趋势的深化,Space Missions Database作为基于Wikidata的航天任务结构化知识库,正推动航天信息学与人工智能的交叉研究。当前前沿方向聚焦于利用该数据集进行航天任务模式挖掘与预测分析,结合自然语言处理技术从非结构化文本中自动补全任务属性,以应对数据覆盖不均的挑战。在商业航天蓬勃发展和深空探测热潮的背景下,该数据集支持对全球航天活动趋势、运营商竞争格局及任务成功率的量化评估,为政策制定、风险评估和航天历史研究提供了可靠的数据基石。其与轨道力学、航天器数据库等相关数据集的联动,进一步构建了多维度的航天知识图谱,赋能智能航天任务规划与决策支持系统的开发。
以上内容由遇见数据集搜集并总结生成



