multifactor_hotpotqa_supp
收藏魔搭社区2025-05-08 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/zeehua/multifactor_hotpotqa_supp
下载链接
链接失效反馈官方服务:
资源简介:
license: MIT License
text:
text-generation:
language:
- en
type:
- question-generation
tags:
- Question Generation
- "arXiv: https://arxiv.org/abs/2310.13512"
---
<!--- 以上YAML section提供属性/tags描述--->
<!--- 以下为markdown格式的dataset描述--->
## 数据集描述
Findings of EMNLP 2023: **Improving Question Generation with Multi-level Content Planning**
论文中使用的 HotpotQA--Supporting Facts 数据集。在原来 HotpotQA[1,2] 的基础上添加了利用 QA2D[3] 生成的 Full Answer。
## 数据集的格式和结构
### 数据格式
在原来的基础上,添加了三个信息。
- p_phrase:正类短语。同时出现在上下文和原数据集标注的问题当中
- n_phrase:负类短语。上下文中与QA对很可能无关的短语
- full answer:利用 QA2D[3] 制作的 `pseudo-gold full answer`。
## 引用
[1] Yang, Zhilin, et al. *HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering*. EMNLP, 2018.
[2] Fei, Zichu, et al. *CQG: A Simple and Effective Controlled Generation Framework for Multi-Hop Question Generation*. EMNLP, 2022.
[3] Demszky, Dorottya, et al. *Transforming Question Answering Datasets Into Natural Language Inference Datasets*. Stanford University. arXiv, 2018.
许可证:MIT许可证
文本配置:
文本生成任务:
语言:
- 英语
任务类型:
- 问题生成(Question Generation)
标签:
- 问题生成(Question Generation)
- arXiv: https://arxiv.org/abs/2310.13512
---
<!-- 以上YAML部分提供属性与标签描述 -->
<!-- 以下为markdown格式的数据集描述 -->
## 数据集描述
EMNLP 2023 研究成果:**《基于多级内容规划的问题生成优化》**
本研究采用的数据集为HotpotQA-支持事实(HotpotQA--Supporting Facts)数据集,在原始HotpotQA[1,2]数据集的基础上,新增了通过QA2D[3]生成的完整答案(Full Answer)。
## 数据集格式与结构
### 数据格式
在原始数据集的基础上,新增了三项信息:
- `p_phrase`:正类短语,即同时出现在上下文与原数据集标注问题中的短语
- `n_phrase`:负类短语,即上下文中与问答对极可能无关的短语
- `full answer`:通过QA2D[3]构建的`伪金标准完整答案(pseudo-gold full answer)`。
## 参考文献
[1] Yang, Zhilin, 等. *《HotpotQA:面向多样化、可解释的多跳问答数据集》*. EMNLP, 2018.
[2] Fei, Zichu, 等. *《CQG:面向多跳问题生成的简易高效可控生成框架》*. EMNLP, 2022.
[3] Demszky, Dorottya, 等. *《将问答数据集转换为自然语言推理数据集》*. 斯坦福大学. arXiv, 2018.
提供机构:
maas
创建时间:
2023-11-26



