space-agency-database
收藏Hugging Face2026-04-01 更新2026-04-02 收录
下载链接:
https://huggingface.co/datasets/juliensimon/space-agency-database
下载链接
链接失效反馈官方服务:
资源简介:
Space Agency Database 是一个全球性的空间机构和相关政府组织的完整数据库,包含来自37个国家的141个机构。数据集来源于Wikidata,涵盖了成立日期、总部位置、领导层、年度预算(如可用)、员工规模和官方网站等信息。该数据集支持对国家空间计划的比较分析,跟踪空间活动的全球化趋势,并识别空间领域的投资模式。数据集是表格形式,包含字段如Wikidata实体ID、机构名称、运营国家、成立日期、总部位置、机构负责人、年度预算(美元)、员工数量、官方网站和成立年份等。数据集适用于表格分类任务,是开放数据,采用CC0-1.0许可。数据集是“Orbital Mechanics Datasets”集合的一部分,与航天器数据库和宇航员数据库等数据集互补。
创建时间:
2026-03-31
原始信息汇总
Space Agency Database 数据集概述
数据集基本信息
- 数据集名称: Space Agency Database
- 发布者: Julien Simon
- 发布日期: 2026年
- 许可证: CC0-1.0
- 语言: 英语
- 数据格式: Parquet
- 数据规模: 小于1K条记录
- 任务类别: 表格分类
- 标签: space, space-agencies, wikidata, open-data, tabular-data, parquet
数据集描述
该数据集是一个全球范围内空间机构和相关政府空间组织的完整数据库。它包含了来自37个国家的141个机构,数据来源于Wikidata。数据集涵盖了从NASA和Roscosmos到亚洲、非洲和拉丁美洲新兴国家项目的所有已知政府空间机构和相关政府间组织。
数据内容与结构
数据集包含以下字段:
wikidata_id: Wikidata实体IDname: 机构名称country: 运营国家founded: 成立日期headquarters: 总部所在地head: 机构负责人budget_usd: 年度预算employees: 员工数量website: 官方网站URLfounded_year: 成立年份
关键统计信息
- 机构总数: 141个
- 涉及国家: 37个
- 最古老的机构: 国家航空航天实验室
- 最大预算机构: 西班牙航天局
- 拥有预算数据的机构: 1个
- 拥有员工数量数据的机构: 5个
- 机构数量最多的国家: 美国、法国、中华人民共和国、德国、印度
数据来源与更新
- 主要来源: Wikidata SPARQL端点
- 识别方法: 通过Q31855类层次结构和基于标签的补充过滤器
- 数据维护: 由WikiProject Spaceflight社区进行社区管理
- 更新频率: 每季度更新
相关数据集
- spacecraft-database: 这些机构运营的航天器
- gcat-launch-vehicles: 空间机构使用的运载火箭
- astronaut-database: 为这些机构飞行的宇航员
使用方式
可通过Hugging Face的datasets库加载使用,支持转换为pandas DataFrame进行数据分析。
引用信息
bibtex @dataset{space_agency_database, author = {Simon, Julien}, title = {Space Agency Database}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/juliensimon/space-agency-database}, note = {Sourced from Wikidata (CC0)} }
搜集汇总
数据集介绍

构建方式
在航天领域全球化的背景下,该数据集通过系统化采集维基数据(Wikidata)的结构化知识构建而成。其构建过程主要依托于Q31855(航天机构)类别的层级体系,并辅以标签筛选机制,以涵盖尚未正式分类的航天项目。数据由维基航天项目社区持续维护与更新,确保了信息的时效性与准确性。数据集以Parquet格式存储,包含141个航天机构的详细信息,覆盖37个国家,每季度通过自动化流程进行数据同步与验证。
特点
该数据集以其全面性与结构化特征脱颖而出,涵盖了从传统航天强国到新兴国家航天机构的详细信息。每条记录均包含机构名称、所属国家、成立日期、总部地点、领导层、年度预算、员工规模及官方网站等关键字段,为比较分析提供了多维视角。值得注意的是,数据集不仅收录了如NASA等知名机构,还纳入了亚洲、非洲和拉丁美洲的新兴航天项目,生动展现了全球航天活动的多元化格局。其与航天器数据库、宇航员数据库的互补性,进一步增强了其在航天研究领域的应用价值。
使用方法
利用该数据集进行航天政策与投资模式分析时,用户可通过Hugging Face的datasets库便捷加载数据,并转换为Pandas DataFrame以进行深入探索。典型应用包括按国家统计航天机构分布、筛选并排序已知预算的机构以识别投资趋势,或提取2000年后成立的机构以观察新时代航天发展动态。数据集支持分组聚合操作,例如计算各国航天预算总和,从而为学术研究、政策制定与行业分析提供实证基础。其开源特性与清晰的数据模式,确保了研究过程的可重复性与透明度。
背景与挑战
背景概述
随着全球航天活动的蓬勃发展与日益全球化,对各国航天机构进行系统性梳理与比较分析的需求愈发凸显。Space Agency Database数据集应运而生,由Julien Simon于2026年创建并发布于Hugging Face平台,隶属于轨道力学数据集系列。该数据集依托维基数据(Wikidata)的结构化知识库,通过社区协作方式持续更新,收录了来自37个国家的141个航天机构及政府相关太空组织。其核心研究问题聚焦于航天机构的跨国比较、太空活动全球化趋势追踪以及航天领域投资模式识别,为航天政策、战略研究及跨学科分析提供了重要的数据基础。
当前挑战
该数据集致力于解决航天机构信息整合与比较分析领域的挑战,具体包括航天机构定义与分类的标准化难题、跨国数据可比性不足以及动态更新机制的构建。在数据构建过程中,挑战主要源于维基数据社区编辑的异构性,导致部分关键字段如预算与员工数量缺失严重;同时,航天机构隶属关系与历史变迁的复杂性,使得数据清洗与验证需耗费大量人工核查。此外,如何确保数据源的时效性与准确性,以反映航天领域的快速演变,亦是持续面临的挑战。
常用场景
经典使用场景
在航天政策与战略研究领域,该数据集为学者提供了全球范围内141个航天机构的标准化信息,涵盖成立时间、总部位置、领导层及预算等关键维度。研究者可借此进行跨国比较分析,例如追踪新兴国家航天项目的崛起轨迹,或评估不同地区在太空探索中的投资强度与资源配置模式,从而揭示全球航天活动的动态演变与结构性特征。
衍生相关工作
围绕该数据集,已衍生出多项关联性研究与实践。例如,与航天器数据库、运载火箭数据库及宇航员数据库的集成分析,构建了从机构、设备到人员的全方位航天知识图谱。此外,基于此数据开展的跨国航天政策比较研究、新兴航天国家发展路径分析等工作,进一步丰富了航天战略与创新管理领域的学术成果。
数据集最近研究
最新研究方向
随着全球航天活动日益多元化和商业化,Space Agency Database数据集为航天政策与战略研究提供了关键的结构化数据支撑。当前研究聚焦于利用该数据集分析新兴国家航天机构的崛起轨迹,特别是亚洲、非洲和拉丁美洲地区在航天领域的投资模式与技术创新动态。结合航天器与宇航员关联数据,学者们正探索多源数据融合方法,以揭示航天产业链的全球化布局与竞争态势,为国际航天合作与治理机制提供实证依据。这一研究方向不仅响应了商业航天和深空探测等热点事件,也推动了开放科学在航天领域的应用,具有重要的学术与政策意义。
以上内容由遇见数据集搜集并总结生成



