five

HotpotQA

收藏
魔搭社区2026-05-16 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/HotpotQA
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: HotpotQA labelTypes: - Text license: - CC BY-SA 4.0 mediaTypes: - Text paperUrl: https://arxiv.org/pdf/1809.09600v1.pdf publishDate: "2018" publishUrl: https://hotpotqa.github.io/ publisher: - Carnegie Mellon University - Stanford University - Google AI Research - University of Montreal tags: - Question - Answering taskTypes: - Visual Question Answering - Multi-hop Question Answering --- # 数据集介绍 ## 简介 HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A 和属性 B?)和比较问题,其中两个实体通过一个共同属性进行比较等。在少文档干扰设置中,QA 模型有 10 个段落,保证能找到黄金段落;在开放域全维基设置中,模型只给出问题和整个维基百科。模型根据其答案准确性和可解释性进行评估,其中前者被测量为具有完全匹配 (EM) 和 unigram F1 的预测答案和黄金答案之间的重叠,后者关注预测的支持事实句子与人类注释的匹配程度(Supporting Fact EM/F1)。该数据集还报告了一个联合指标,它鼓励系统同时在两项任务上表现良好。 来源:通过迭代查询生成回答复杂的开放域问题 ## 引文 ``` @article{yang2018hotpotqa, title={HotpotQA: A dataset for diverse, explainable multi-hop question answering}, author={Yang, Zhilin and Qi, Peng and Zhang, Saizheng and Bengio, Yoshua and Cohen, William W and Salakhutdinov, Ruslan and Manning, Christopher D}, journal={arXiv preprint arXiv:1809.09600}, year={2018} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: HotpotQA labelTypes: - 文本 license: - CC BY-SA 4.0 mediaTypes: - 文本 paperUrl: https://arxiv.org/pdf/1809.09600v1.pdf publishDate: 2018年 publishUrl: https://hotpotqa.github.io/ publisher: - 卡内基梅隆大学 - 斯坦福大学 - 谷歌人工智能研究(Google AI Research) - 蒙特利尔大学 tags: - 问题 - 问答 taskTypes: - 视觉问答(Visual Question Answering) - 多跳问答(Multi-hop Question Answering) --- # 数据集介绍 ## 简介 HotpotQA是采集自英文维基百科的问答数据集,包含约11.3万个众包构建的问题,此类问题的解答需依托两篇维基百科文章的介绍段落方能完成。数据集中的每个问题均配有两段黄金参考段落,以及经众包人员标注的、用于解答该问题的必需支撑事实句子列表。 HotpotQA涵盖多样化推理场景,包括涉及问题中缺失实体的问题、交叉属性问题(即“满足属性A与属性B的对象是什么?”),以及通过共同属性对两个实体进行对比的比较类问题等。在少文档干扰设置下,问答模型可获得10个候选段落,且其中必然包含黄金参考段落;而在开放域全维基设置中,模型仅能获取问题与完整的维基百科资源。该数据集的评估包含两大维度:其一为答案准确性,通过预测答案与标准答案的完全匹配度(Exact Match, EM)以及单字元F1(Unigram F1)值衡量两者的重叠程度;其二为可解释性,聚焦于预测的支撑事实句子与人工标注内容的匹配程度(支撑事实EM/F1(Supporting Fact EM/F1))。此外,该数据集还设置了联合评估指标,以激励系统同时在两项任务上实现良好表现。 来源:通过迭代查询生成复杂开放域问答的数据集 ## 引文 @article{yang2018hotpotqa, title={HotpotQA: A dataset for diverse, explainable multi-hop question answering}, author={Yang, Zhilin and Qi, Peng and Zhang, Saizheng and Bengio, Yoshua and Cohen, William W and Salakhutdinov, Ruslan and Manning, Christopher D}, journal={arXiv preprint arXiv:1809.09600}, year={2018} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HotpotQA是一个基于英语维基百科的多跳问答数据集,包含约113K众包问题,这些问题需要结合两篇维基百科文章进行推理才能回答。数据集提供黄金段落和支持事实句子,用于评估模型的答案准确性和可解释性,支持少文档干扰和开放域全维基两种设置。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作