agicorp/piqa
收藏Hugging Face2024-03-23 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/agicorp/piqa
下载链接
链接失效反馈官方服务:
资源简介:
PIQA数据集是一个用于物理常识推理的问答数据集,旨在挑战自然语言理解系统。数据集包含多个选择题,每个问题有两个可能的解决方案,其中一个正确。数据集的结构包括目标问题、两个解决方案和标签,标签指示哪个解决方案是正确的。数据集分为训练集、测试集和验证集,分别包含16113、3084和1838个例子。数据集的创建过程涉及从instructables.com获取灵感,并通过众包方式收集和验证数据。
PIQA数据集是一个用于物理常识推理的问答数据集,旨在挑战自然语言理解系统。数据集包含多个选择题,每个问题有两个可能的解决方案,其中一个正确。数据集的结构包括目标问题、两个解决方案和标签,标签指示哪个解决方案是正确的。数据集分为训练集、测试集和验证集,分别包含16113、3084和1838个例子。数据集的创建过程涉及从instructables.com获取灵感,并通过众包方式收集和验证数据。
提供机构:
agicorp
原始信息汇总
数据集概述
数据集名称
- 名称: Physical Interaction: Question Answering (PIQA)
- 别名: PIQA
数据集基本信息
- 语言: 英语 (
en) - 许可证: 未知
- 多语言性: 单语
- 大小: 10K<n<100K
- 源数据: 原始数据
- 任务类别: 问答
- 任务ID: 多项选择问答 (
multiple-choice-qa) - 论文代码ID: piqa
数据集结构
- 数据实例: 包含目标问题、两个解决方案及正确答案标签。
- 目标: 字符串类型,需要物理常识来正确回答的问题。
- 解决方案1: 字符串类型,第一个解决方案。
- 解决方案2: 字符串类型,第二个解决方案。
- 标签: 类别标签,
0表示sol1正确,1表示sol2正确。
- 数据分割:
- 训练集: 16113个例子,4104026字节。
- 测试集: 3084个例子,761521字节。
- 验证集: 1838个例子,464321字节。
数据集创建
- 注释创建者: 众包
- 语言创建者: 众包和发现
- 初始数据收集和标准化: 使用AFLite算法进行数据清洗,去除低一致性的例子和风格上的伪影。
- 注释过程: 通过众包完成提示获得注释。
- 注释者: 付费众包工作者
使用数据集的考虑
-
许可证信息: 未知
-
引用信息:
@inproceedings{Bisk2020, author = {Yonatan Bisk and Rowan Zellers and Ronan Le Bras and Jianfeng Gao and Yejin Choi}, title = {PIQA: Reasoning about Physical Commonsense in Natural Language}, booktitle = {Thirty-Fourth AAAI Conference on Artificial Intelligence}, year = {2020}, }
搜集汇总
数据集介绍

构建方式
PIQA数据集的构建基于物理常识推理任务,旨在通过日常生活中的实际问题来评估自然语言理解系统的能力。数据集的灵感来源于instructables.com,该网站提供了大量关于如何使用日常材料进行制作、修理等任务的指导。数据集的构建过程包括从instructables.com中提取问题和解决方案,并由众包工作者生成两个可能的解决方案,其中一个为正确答案,另一个为错误答案。通过这种方式,数据集不仅涵盖了常见的解决方案,还特别关注了非典型的、更具挑战性的解决方案,从而增强了数据集的多样性和复杂性。
使用方法
PIQA数据集主要用于多选题问答任务,模型需要根据给定的问题和两个可能的解决方案选择正确的答案。使用该数据集时,用户可以从训练集中提取数据进行模型训练,利用验证集进行模型调优,并通过测试集评估模型的性能。数据集的每个样本包含一个目标问题(goal)、两个解决方案(sol1和sol2)以及一个标签(label),标签指示哪个解决方案是正确的。测试集不包含标签,用户需要将预测结果提交至排行榜以获取评估结果。通过这种方式,PIQA数据集为物理常识推理任务提供了一个标准化的评估平台。
背景与挑战
背景概述
PIQA(Physical Interaction: Question Answering)数据集由Yonatan Bisk等人于2020年创建,旨在推动自然语言理解系统在物理常识推理方面的能力。该数据集的核心研究问题是评估模型在日常情境中处理物理常识问题的能力,这些问题通常涉及非典型解决方案。PIQA的构建灵感来源于instructables.com,该网站提供了大量关于如何使用日常材料进行手工制作、修理等任务的指导。通过引入这一数据集,研究者们希望为机器人与世界互动及理解自然语言提供一个重要的基准,从而推动人工智能在物理常识推理领域的进展。
当前挑战
PIQA数据集的主要挑战在于其任务的复杂性,即要求模型在给定的问题和两个可能的解决方案中选择正确的答案,这需要模型具备高度的物理常识推理能力。构建过程中,数据集的创建者面临了从非典型情境中提取有效任务的挑战,并通过众包方式确保了数据的多样性和质量。此外,数据集的清洗过程也面临挑战,需去除低质量样本以确保模型性能评估的准确性。总体而言,PIQA数据集的挑战在于其对模型物理常识推理能力的严格要求以及数据集构建过程中的复杂性。
常用场景
经典使用场景
PIQA数据集的经典使用场景主要集中在物理常识推理任务中,特别是在自然语言理解系统中。该数据集通过提供日常生活中常见的物理问题及其两个可能的解决方案,要求模型或人类选择最合适的答案。这种任务设计有助于评估和提升模型在处理物理常识问题上的能力,尤其是在机器人与世界交互和理解自然语言的背景下。
解决学术问题
PIQA数据集解决了在自然语言处理领域中物理常识推理的学术研究问题。通过提供一个包含日常物理常识问题的基准数据集,PIQA帮助研究人员评估和改进模型在处理这类问题上的表现。这对于推动AI在理解物理世界中的应用具有重要意义,尤其是在构建能够与环境交互的智能系统方面。
实际应用
PIQA数据集的实际应用场景广泛,包括但不限于机器人技术、智能家居系统和教育工具。在这些应用中,模型需要理解并执行基于物理常识的任务,如识别正确的工具或材料来完成特定任务。此外,该数据集还可用于开发和测试智能助手,帮助用户解决日常生活中的物理问题。
数据集最近研究
最新研究方向
在物理常识推理领域,PIQA数据集的最新研究方向主要集中在提升自然语言理解系统对日常物理交互任务的推理能力。该数据集通过引入非典型解决方案,挑战现有模型在处理复杂物理常识问题时的表现。研究者们致力于开发更高效的模型,以准确识别和选择最合适的解决方案,从而推动机器人与现实世界交互能力的提升。此外,PIQA数据集的广泛应用也促进了多模态学习的发展,尤其是在结合图像和文本信息进行推理方面,展现了巨大的潜力和研究价值。
以上内容由遇见数据集搜集并总结生成



