agicorp/piqa|物理常识推理数据集|问答系统数据集
收藏数据集概述
数据集名称
- 名称: Physical Interaction: Question Answering (PIQA)
- 别名: PIQA
数据集基本信息
- 语言: 英语 (
en
) - 许可证: 未知
- 多语言性: 单语
- 大小: 10K<n<100K
- 源数据: 原始数据
- 任务类别: 问答
- 任务ID: 多项选择问答 (
multiple-choice-qa
) - 论文代码ID: piqa
数据集结构
- 数据实例: 包含目标问题、两个解决方案及正确答案标签。
- 目标: 字符串类型,需要物理常识来正确回答的问题。
- 解决方案1: 字符串类型,第一个解决方案。
- 解决方案2: 字符串类型,第二个解决方案。
- 标签: 类别标签,
0
表示sol1
正确,1
表示sol2
正确。
- 数据分割:
- 训练集: 16113个例子,4104026字节。
- 测试集: 3084个例子,761521字节。
- 验证集: 1838个例子,464321字节。
数据集创建
- 注释创建者: 众包
- 语言创建者: 众包和发现
- 初始数据收集和标准化: 使用AFLite算法进行数据清洗,去除低一致性的例子和风格上的伪影。
- 注释过程: 通过众包完成提示获得注释。
- 注释者: 付费众包工作者
使用数据集的考虑
-
许可证信息: 未知
-
引用信息:
@inproceedings{Bisk2020, author = {Yonatan Bisk and Rowan Zellers and Ronan Le Bras and Jianfeng Gao and Yejin Choi}, title = {PIQA: Reasoning about Physical Commonsense in Natural Language}, booktitle = {Thirty-Fourth AAAI Conference on Artificial Intelligence}, year = {2020}, }

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Global Elevation Data (GED)
全球高程数据集,提供全球范围内的高程信息,包括陆地和海洋地形。数据集包含高分辨率的高程数据,适用于地理信息系统(GIS)分析、地形建模和环境研究等领域。
lpdaac.usgs.gov 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
中国1km分辨率逐月NDVI数据集(2001-2023年)
中国1km分辨率逐月NDVI数据集(2001-2023年)根据MODIS MOD13A2数据进行月度最大值合成、镶嵌和裁剪后制作而成,包含多个TIF文件,每个TIF文件对应该月最大值NDVI数据,文件以时间命名。数据值域改为-0.2~1,不再需要除以一万,另外范围扩大到中国及周边地区,可以自行裁剪。数据分为两个文件夹,MVC文件夹中为MOD13A2 NDVI逐月最大值合成结果,mod1k_SGfilter为MVC中数据S-G滤波后的结果。
国家地球系统科学数据中心 收录