lmqg/qg_frquad_dummy
收藏Hugging Face2022-11-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lmqg/qg_frquad_dummy
下载链接
链接失效反馈官方服务:
资源简介:
lmqg/qg_frquad是一个专门为问题生成任务设计的法语数据集,基于FQuAD数据集进行修改。数据集包含详细的文本信息,如问题、段落和答案,并使用特殊标记突出显示关键信息,以支持模型训练。用户需通过FQuAD官方网站申请访问权限后方可使用。
提供机构:
lmqg
原始信息汇总
数据集概述
- 名称: lmqg/qg_frquad
- 语言: 法语 (fr)
- 许可: cc-by-4.0
- 多语言性: 单语种
- 大小: 10K<n<100K
- 任务类别: text2text-generation
- 任务ID: 无
- 美观名称: FQuAD for question generation
- 标签: question-generation
数据集描述
- 摘要: 该数据集是QG-Bench的一个子集,是一个统一的问题生成基准。它是FQuAD的修改版本,专门用于问题生成任务。
- 重要注意事项: 数据集的许可属于FQuAD,使用前需检查相关指南并请求访问权限。
支持的任务和评测指标
- 任务: question-generation
- 评测指标: BLEU4/METEOR/ROUGE-L/BERTScore/MoverScore
数据集结构
- 数据字段:
question: 字符串paragraph: 字符串answer: 字符串sentence: 字符串paragraph_answer: 字符串,答案以特殊标记<hl>高亮paragraph_sentence: 字符串,包含答案的句子以特殊标记<hl>高亮sentence_answer: 字符串,答案以特殊标记<hl>高亮
- 数据分割:
train: 17543validation: 3188test: 3188
引用信息
@inproceedings{ushio-etal-2022-generative, title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration: {A} {U}nified {B}enchmark and {E}valuation", author = "Ushio, Asahi and Alva-Manchego, Fernando and Camacho-Collados, Jose", booktitle = "Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing", month = dec, year = "2022", address = "Abu Dhabi, U.A.E.", publisher = "Association for Computational Linguistics", }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



