five

CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context
下载链接
链接失效反馈
官方服务:
资源简介:
squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context是一个问题生成数据集,包含1112937条记录,用于训练模型根据给定上下文和答案生成问题。该数据集基于pragnakalp/squad_v2_french_translated数据集,并使用FrenchQA数据集中的问题进行了增强。数据集包含了21种不同的提示语,以适应不同的语言使用场景。

squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context is a question generation dataset containing 1,112,937 entries designed for training models to generate questions based on given context and answers. The dataset is based on the pragnakalp/squad_v2_french_translated dataset and has been augmented with questions from the FrenchQA dataset. It includes 21 different prompts to cater to various linguistic usage scenarios.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

基本信息

  • 名称: squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context
  • 语言: 法语
  • 许可: Apache 2.0
  • 数据量: 1,112,937 条记录
  • 任务类别: 文本生成
  • 标签: DFP, french prompts
  • 多语言性: 单语种
  • 数据来源: pragnakalp/squad_v2_french_translated

数据集描述

该数据集是 Dataset of French Prompts (DFP) 的一个子集,包含 1,112,937 条记录,适用于问题生成(带答案和上下文)任务。原始数据来自 pragnakalp/squad_v2_french_translated 数据集,并通过 FrenchQA 数据集中的问题进行了增强。

提示列表

该数据集使用了 21 个提示,这些提示采用了直陈式、第二人称单数和第二人称复数的形式。以下是部分提示示例:

plaintext Déterminer la question qui aurait pu être posée pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :,
Détermine la question que tu aurais pu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :,
Déterminez la question que vous auriez pu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :,
...

数据分割

  • 训练集: 1,112,937 条样本
  • 验证集: 无
  • 测试集: 无

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_answer_and_context")

引用

plaintext @misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

许可

Apache 2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作