hotpotqa/hotpot_qa
收藏Hugging Face2025-08-11 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/hotpotqa/hotpot_qa
下载链接
链接失效反馈资源简介:
HotpotQA是一个包含113k个基于Wikipedia的问答对的新数据集,具有四个关键特点:(1) 问题需要查找和推理多个支持文档来回答;(2) 问题多样化,不受任何现有知识库或知识模式的限制;(3) 提供了句子级别的支持事实,允许问答系统在强监督下进行推理并解释预测;(4) 提供了一种新类型的事实比较问题,以测试问答系统提取相关事实并进行必要比较的能力。
HotpotQA is a novel dataset consisting of 113k Wikipedia-based question-answer pairs with four key features: (1) Answering the questions requires retrieving and reasoning over multiple supporting documents; (2) The questions are diverse and not constrained by any existing knowledge base or knowledge schema; (3) Sentence-level supporting facts are provided, allowing question answering (QA) systems to conduct reasoning under strong supervision and interpret their predictions; (4) A new type of factual comparison question is introduced to test the ability of QA systems to extract relevant facts and perform necessary comparisons.
提供机构:
hotpotqa
原始信息汇总
数据集概述
基本信息
- 数据集名称: HotpotQA
- 语言: 英语
- 许可证: CC BY-SA 4.0
- 多语言性: 单语种
- 标签: multi-hop
- 数据集大小: 100K<n<1M
- 源数据: 原始数据
- 任务类别: 问答
数据集配置
distractor
- 特征:
id: 字符串question: 字符串answer: 字符串type: 字符串level: 字符串supporting_facts: 字典,包含title(字符串)和sent_id(int32)context: 字典,包含title(字符串)和sentences(字符串列表)
- 分割:
train: 90447个样本,552949315字节validation: 7405个样本,45716111字节
- 下载大小: 612746344字节
- 数据集大小: 598665426字节
fullwiki
- 特征:
id: 字符串question: 字符串answer: 字符串type: 字符串level: 字符串supporting_facts: 字典,包含title(字符串)和sent_id(int32)context: 字典,包含title(字符串)和sentences(字符串列表)
- 分割:
train: 90447个样本,552949315字节validation: 7405个样本,46848601字节test: 7405个样本,46000102字节
- 下载大小: 660094672字节
- 数据集大小: 645798018字节
搜集汇总
数据集介绍

构建方式
HotpotQA数据集通过众包方式构建,包含113,000个基于维基百科的问题-答案对。该数据集的设计旨在测试多跳问答系统的能力,要求系统从多个支持文档中提取信息并进行推理。数据集提供了句子级别的支持事实,以便系统能够进行强监督推理,并解释其预测结果。此外,数据集还引入了新的事实比较问题类型,以测试系统在提取相关事实和进行必要比较方面的能力。
特点
HotpotQA数据集的主要特点包括:(1)问题需要多跳推理,涉及多个支持文档;(2)问题类型多样,不受限于任何预先存在的知识库或知识模式;(3)提供句子级别的支持事实,支持系统的强监督推理和解释;(4)包含新的比较问题类型,测试系统的比较能力。数据集分为两个配置:distractor和fullwiki,分别用于不同的训练和评估场景。
使用方法
HotpotQA数据集适用于多跳问答任务的研究和开发。用户可以通过HuggingFace的datasets库加载数据集,并根据需要选择distractor或fullwiki配置。数据集提供了问题、答案、支持事实和上下文信息,用户可以利用这些信息训练和评估多跳问答模型。数据集的结构清晰,包含训练集、验证集和测试集,方便用户进行模型训练和性能评估。
背景与挑战
背景概述
HotpotQA数据集由Yang等人于2018年创建,旨在推动多跳问答(Multi-hop Question Answering)领域的发展。该数据集包含113,000个基于维基百科的问题-答案对,具有四个核心特征:(1)问题需要从多个支持文档中进行推理;(2)问题类型多样,不受预设知识库或知识模式的限制;(3)提供句子级别的支持事实,便于系统进行强监督推理并解释预测结果;(4)引入事实比较问题,测试系统提取相关事实并进行比较的能力。HotpotQA的发布对问答系统的设计与评估产生了深远影响,尤其是在复杂推理和解释性问答方面。
当前挑战
HotpotQA数据集的主要挑战在于其多跳推理需求,即系统需要从多个文档中提取并整合信息以回答问题。此外,数据集中的问题类型多样,涵盖了事实比较等复杂任务,这对系统的信息提取和推理能力提出了更高要求。在构建过程中,如何确保数据集的多样性和覆盖广泛的知识领域,以及如何有效地标注和验证句子级别的支持事实,也是该数据集面临的重要挑战。这些挑战不仅推动了问答系统的技术进步,也为相关领域的研究提供了丰富的实验平台。
常用场景
经典使用场景
HotpotQA数据集的经典使用场景主要集中在多跳问答(Multi-hop Question Answering)任务中。该数据集通过提供需要多步推理的问题,要求模型不仅能够从多个文档中提取信息,还需进行跨文档的推理以得出最终答案。这种场景特别适用于测试和提升问答系统在复杂推理任务中的表现,尤其是在需要综合多个信息源的情况下。
实际应用
在实际应用中,HotpotQA数据集可以用于构建和优化智能客服系统、知识图谱问答系统以及教育辅助工具等。这些应用场景需要系统具备处理复杂问题的能力,例如在法律咨询、医疗诊断或教育辅导中,用户可能需要系统提供多步骤推理的答案,而HotpotQA正是为此类需求提供了丰富的训练和测试数据。
衍生相关工作
基于HotpotQA数据集,研究者们开发了多种多跳问答模型,如基于图神经网络的推理模型、记忆网络等。这些模型在处理复杂问答任务时表现出色,推动了多跳问答技术的发展。此外,HotpotQA还激发了对解释性问答系统的研究,使得模型不仅能够给出答案,还能解释推理过程,增强了系统的透明性和可信度。
以上内容由遇见数据集搜集并总结生成



