five

CATIE-AQ/fquad_fr_prompt_question_generation_with_answer

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/fquad_fr_prompt_question_generation_with_answer
下载链接
链接失效反馈
官方服务:
资源简介:
fquad_fr_prompt_question_generation_with_answer是法语提示数据集(DFP)的一个子集,包含526,218行数据,用于问题生成(带答案)任务。原始数据来源于FQuAD数据集,并通过FrenchQA数据集中的SQUAD 2.0格式问题进行了增强。由于FQuAD的许可证不允许共享数据,因此仅共享了用于重新创建数据集的提示。数据集中包含了22个提示,用于生成问题。数据集分为训练集(456,082个样本)和验证集(70,136个样本),没有测试集。

fquad_fr_prompt_question_generation_with_answer is a subset of the French Prompt Dataset (DFP), containing 526,218 data rows, and is tailored for the question generation task with corresponding answers. The original corpus is derived from the FQuAD dataset, and has been augmented with questions formatted per the SQUAD 2.0 standard from the FrenchQA dataset. Given that the FQuAD license prohibits direct data redistribution, only the prompts necessary to reconstruct the dataset are shared publicly. The dataset includes 22 distinct prompts for question generation, and is split into a training subset with 456,082 samples and a validation subset with 70,136 samples, with no test set provided.
提供机构:
CATIE-AQ
原始信息汇总

fquad_fr_prompt_question_generation_with_answer

概述

fquad_fr_prompt_question_generation_with_answerDataset of French Prompts (DFP) 的一个子集。
它包含 526,218 行数据,可用于带有答案的问题生成任务。
原始数据(无提示)来自 dHoffschmidt 等人的数据集 FQuAD,并通过 FrenchQA 数据集中的 SQUAD 2.0 格式的问题进行了增强。
由于 FQuAD 的许可证不允许共享数据,我们仅共享所使用的提示,以便用户可以以与 Muennighoff 等人的 xP3 数据集相同的格式自行重新创建数据集。

使用的提示

列表

该数据集创建了 22 个提示。逻辑应用包括提出陈述语气、使用“你”和“您”形式的提示。

Quelle question donnerait la réponse suivante ? Réponse : "+answer+"; Question :,
Déterminer la question qui aurait pu être posée pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Détermine la question que tu aurais pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Déterminez la question que vous auriez pu poser pour obtenir la réponse suivante . Réponse : "+answer+"; Question :,
Quelle question aurait pu être posée pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Quelle question aurais-tu pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Quelle question auriez-vous pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Quelle question aurait pu être posée pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Quelle question aurais-tu pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Quelle question auriez-vous pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :,
Sachant la réponse suivante : "+answer+" Générer une bonne question : ,
Sachant la réponse suivante : "+answer+" Génère une bonne question : ,
Sachant la réponse suivante : "+answer+" Générez une bonne question : ,
Sachant la réponse suivante : "+answer+" Trouver une bonne question : ,
Sachant la réponse suivante : "+answer+" Trouves une bonne question : ,
Sachant la réponse suivante : "+answer+" Trouvez une bonne question : ,
Sachant la réponse suivante : "+answer+" Créer une bonne question : ,
Sachant la réponse suivante : "+answer+" Crée trouver une bonne question : ,
Sachant la réponse suivante : "+answer+" Créez trouver une bonne question : ,
Sachant la réponse suivante : "+answer+" Ecrire une bonne question : ,
Sachant la réponse suivante : "+answer+" Ecris une bonne question : ,
Sachant la réponse suivante : "+answer+" Ecrivez une bonne question

数据分割

  • train 包含 456,082 个样本
  • valid 包含 70,136 个样本
  • 没有测试集分割

许可证

CC BY-NC-SA 3.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作