five

zeaver/multifactor_hotpotqa_suppfacts

收藏
Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeaver/multifactor_hotpotqa_suppfacts
下载链接
链接失效反馈
官方服务:
资源简介:
MultiFactor-HotpotQA-SuppFacts数据集是基于HotpotQA数据集的支持事实部分,并在EMNLP 2023 Findings中提出。该数据集在CQG提供的数据集基础上增加了`p_hrase`、`n_phrase`和`full answer`属性,并使用QA2D重构了完整答案。数据集包含训练、开发和测试三个部分的JSON文件,每个文件包含上下文、答案、问题、正面短语、负面短语和完整答案等信息。

MultiFactor-HotpotQA-SuppFacts数据集是基于HotpotQA数据集的支持事实部分,并在EMNLP 2023 Findings中提出。该数据集在CQG提供的数据集基础上增加了`p_hrase`、`n_phrase`和`full answer`属性,并使用QA2D重构了完整答案。数据集包含训练、开发和测试三个部分的JSON文件,每个文件包含上下文、答案、问题、正面短语、负面短语和完整答案等信息。
提供机构:
zeaver
原始信息汇总

MultiFactor-HotpotQA-SuppFacts

1. 数据集描述

MultiFactor 数据集 -- HotpotQA 支持事实部分,在 EMNLP 2023 Findings 中提出:Improving Question Generation with Multi-level Content Planning

基于 CQG 数据集,我们为每个数据实例添加了 p_hrasen_phrasefull answer 属性。完整答案通过 QA2D 重建。更多细节参见论文 GitHub:https://github.com/zeaver/MultiFactor。

2. 数据集来源

3. 数据集结构

tex . ├── dev.json ├── test.json ├── train.json ├── fa_model_inference ├── dev.json ├── test.json └── train.json

每个分割是一个 json 文件,不是 jsonl。请直接使用 json.load(f) 加载。数据集模式如下:

json { "context": "给定的输入上下文", "answer": "给定的答案", "question": "对应的问句", "p_phrase": "给定上下文中的正向短语", "n_phrase": "负向短语", "full answer": "伪金标准完整答案(q + a -> 陈述句)", }

我们还提供了 FA_Model 的推理结果在 fa_model_inference/{split}.json

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作