CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context
收藏数据集概述
基本信息
- 名称: squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context
- 语言: 法语
- 许可: Apache 2.0
- 数据量: 1,112,937 条记录
- 任务类别: 文本生成
- 标签: DFP, french prompts
- 多语言性: 单语种
- 数据来源: pragnakalp/squad_v2_french_translated
数据集描述
该数据集是 Dataset of French Prompts (DFP) 的一个子集,包含 1,112,937 条记录,适用于问题生成(带答案和上下文)任务。原始数据来自 pragnakalp/squad_v2_french_translated 数据集,并通过 FrenchQA 数据集中的问题进行了增强。
提示列表
该数据集使用了 21 个提示,这些提示采用了直陈式、第二人称单数和第二人称复数的形式。以下是部分提示示例:
plaintext
Déterminer la question qui aurait pu être posée pour obtenir la réponse suivante dans le contexte donné.
Contexte : "+context+";
Réponse : "+answer+";
Question :,
Détermine la question que tu aurais pu poser pour obtenir la réponse suivante dans le contexte donné.
Contexte : "+context+";
Réponse : "+answer+";
Question :,
Déterminez la question que vous auriez pu poser pour obtenir la réponse suivante dans le contexte donné.
Contexte : "+context+";
Réponse : "+answer+";
Question :,
...
数据分割
- 训练集: 1,112,937 条样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context")
引用
plaintext
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可
Apache 2.0



