five

icelab/ntrs_meta|航天技术数据集|信息检索数据集

收藏
hugging_face2022-08-18 更新2024-03-04 收录
航天技术
信息检索
下载链接:
https://hf-mirror.com/datasets/icelab/ntrs_meta
下载链接
链接失效反馈
资源简介:
NTRS数据集收集了由NASA资助或创建的科学和技术信息,提供了元数据以及摘要和全文的访问。该数据集包含所有在NTRS上索引的摘要、标题和相关元数据。数据集涵盖了从1917年到2022年6月18日的NASA资助项目的摘要和相关元数据,是航天器设计和空间科学领域语言建模的丰富数据源。
提供机构:
icelab
原始信息汇总

数据集概述

数据集描述

数据集总结

  • 名称: NTRS
  • 内容: 包含NASA资助或创建的科学和技术信息的摘要、标题及关联元数据。
  • 来源: 直接从NASA技术报告服务器(NTRS)获取。
  • 规模: 超过508,000个对象(摘要)。
  • 时间范围: 1917年至2022年6月18日。

数据集结构

数据实例

  • 数量: 超过508,000个对象。
  • 类型: 摘要及关联元数据。

数据字段

  • 核心字段:
    • abstract: 摘要内容。
    • subjectCategories: 主题分类。
    • keywords: 关键词。
    • center: 中心信息,包括代码、名称和ID。
  • 其他字段:
    • copyright: 版权信息。
    • exportControl: 出口控制信息。
    • created: 创建日期。
    • distributionDate: 分发日期。
    • otherReportNumbers: 其他报告编号。
    • onlyAbstract: 是否仅包含摘要。
    • sensitiveInformation: 敏感信息级别。
    • title: 报告标题。
    • stiType: 报告类型。
    • distribution: 分发状态。
    • submittedDate: 提交日期。
    • isLessonsLearned: 是否为经验教训。
    • disseminated: 传播类型。
    • stiTypeDetails: 报告类型详细信息。
    • technicalReviewType: 技术审查类型。
    • modified: 修改日期。
    • id: 唯一标识符。
    • publications: 相关出版物信息。
    • status: 数据状态。
    • authorAffiliations: 作者隶属关系。
    • meetings: 相关会议信息。
    • fundingNumbers: 资助编号。
    • redactedDate: 修订日期。
    • sourceIdentifiers: 来源标识符。

数据集创建

来源数据

  • 类型: 原始数据。
  • 处理: 从NTRS直接下载并清理重复的摘要。

使用数据注意事项

  • 主要关注字段: abstract, subjectCategory, keywords, center

附加信息

许可信息

  • 版权状态: 美国政府作品通常不受版权保护,但可能包含受版权保护的第三方内容。
  • 使用限制: 第三方版权内容需遵守版权法,未经许可不得修改、复制或分发。

贡献

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录

BraTS

BraTS(Brain Tumor Segmentation)数据集是一个专门用于脑肿瘤分割研究的数据集。它包含了多模态的MRI图像,包括T1、T1c(对比增强T1)、T2和FLAIR序列,以及相应的肿瘤分割标签。数据集主要用于评估和比较不同脑肿瘤分割算法的效果。

www.med.upenn.edu 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录