five

multifactor_hotpotqa_supp

收藏
魔搭社区2025-05-08 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/zeehua/multifactor_hotpotqa_supp
下载链接
链接失效反馈
官方服务:
资源简介:
license: MIT License text: text-generation: language: - en type: - question-generation tags: - Question Generation - "arXiv: https://arxiv.org/abs/2310.13512" --- <!--- 以上YAML section提供属性/tags描述---> <!--- 以下为markdown格式的dataset描述---> ## 数据集描述 Findings of EMNLP 2023: **Improving Question Generation with Multi-level Content Planning** 论文中使用的 HotpotQA--Supporting Facts 数据集。在原来 HotpotQA[1,2] 的基础上添加了利用 QA2D[3] 生成的 Full Answer。 ## 数据集的格式和结构 ### 数据格式 在原来的基础上,添加了三个信息。 - p_phrase:正类短语。同时出现在上下文和原数据集标注的问题当中 - n_phrase:负类短语。上下文中与QA对很可能无关的短语 - full answer:利用 QA2D[3] 制作的 `pseudo-gold full answer`。 ## 引用 [1] Yang, Zhilin, et al. *HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering*. EMNLP, 2018. [2] Fei, Zichu, et al. *CQG: A Simple and Effective Controlled Generation Framework for Multi-Hop Question Generation*. EMNLP, 2022. [3] Demszky, Dorottya, et al. *Transforming Question Answering Datasets Into Natural Language Inference Datasets*. Stanford University. arXiv, 2018.

许可证:MIT许可证 文本配置: 文本生成任务: 语言: - 英语 任务类型: - 问题生成(Question Generation) 标签: - 问题生成(Question Generation) - arXiv: https://arxiv.org/abs/2310.13512 --- <!-- 以上YAML部分提供属性与标签描述 --> <!-- 以下为markdown格式的数据集描述 --> ## 数据集描述 EMNLP 2023 研究成果:**《基于多级内容规划的问题生成优化》** 本研究采用的数据集为HotpotQA-支持事实(HotpotQA--Supporting Facts)数据集,在原始HotpotQA[1,2]数据集的基础上,新增了通过QA2D[3]生成的完整答案(Full Answer)。 ## 数据集格式与结构 ### 数据格式 在原始数据集的基础上,新增了三项信息: - `p_phrase`:正类短语,即同时出现在上下文与原数据集标注问题中的短语 - `n_phrase`:负类短语,即上下文中与问答对极可能无关的短语 - `full answer`:通过QA2D[3]构建的`伪金标准完整答案(pseudo-gold full answer)`。 ## 参考文献 [1] Yang, Zhilin, 等. *《HotpotQA:面向多样化、可解释的多跳问答数据集》*. EMNLP, 2018. [2] Fei, Zichu, 等. *《CQG:面向多跳问题生成的简易高效可控生成框架》*. EMNLP, 2022. [3] Demszky, Dorottya, 等. *《将问答数据集转换为自然语言推理数据集》*. 斯坦福大学. arXiv, 2018.
提供机构:
maas
创建时间:
2023-11-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作