zeaver/multifactor_hotpotqa_suppfacts
收藏Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeaver/multifactor_hotpotqa_suppfacts
下载链接
链接失效反馈官方服务:
资源简介:
MultiFactor-HotpotQA-SuppFacts数据集是基于HotpotQA数据集的支持事实部分,并在EMNLP 2023 Findings中提出。该数据集在CQG提供的数据集基础上增加了`p_hrase`、`n_phrase`和`full answer`属性,并使用QA2D重构了完整答案。数据集包含训练、开发和测试三个部分的JSON文件,每个文件包含上下文、答案、问题、正面短语、负面短语和完整答案等信息。
MultiFactor-HotpotQA-SuppFacts数据集是基于HotpotQA数据集的支持事实部分,并在EMNLP 2023 Findings中提出。该数据集在CQG提供的数据集基础上增加了`p_hrase`、`n_phrase`和`full answer`属性,并使用QA2D重构了完整答案。数据集包含训练、开发和测试三个部分的JSON文件,每个文件包含上下文、答案、问题、正面短语、负面短语和完整答案等信息。
提供机构:
zeaver
原始信息汇总
MultiFactor-HotpotQA-SuppFacts
1. 数据集描述
MultiFactor 数据集 -- HotpotQA 支持事实部分,在 EMNLP 2023 Findings 中提出:Improving Question Generation with Multi-level Content Planning。
基于 CQG 数据集,我们为每个数据实例添加了 p_hrase、n_phrase 和 full answer 属性。完整答案通过 QA2D 重建。更多细节参见论文 GitHub:https://github.com/zeaver/MultiFactor。
2. 数据集来源
- 仓库: https://github.com/zeaver/MultiFactor
- 论文: Improving Question Generation with Multi-level Content Planning,EMNLP Findings,2023。
3. 数据集结构
tex . ├── dev.json ├── test.json ├── train.json ├── fa_model_inference ├── dev.json ├── test.json └── train.json
每个分割是一个 json 文件,不是 jsonl。请直接使用 json.load(f) 加载。数据集模式如下:
json { "context": "给定的输入上下文", "answer": "给定的答案", "question": "对应的问句", "p_phrase": "给定上下文中的正向短语", "n_phrase": "负向短语", "full answer": "伪金标准完整答案(q + a -> 陈述句)", }
我们还提供了 FA_Model 的推理结果在 fa_model_inference/{split}.json。



