CATIE-AQ/fquad_fr_prompt_question_generation_with_context
收藏fquad_fr_prompt_question_generation_with_context
概述
fquad_fr_prompt_question_generation_with_context 是 Dataset of French Prompts (DFP) 的一个子集。
它包含 574,056 行数据,可用于带有上下文的问题生成任务。
原始数据(不带提示)来自 dHoffschmidt 等人的 FQuAD 数据集,并通过 FrenchQA 数据集中的 SQUAD 2.0 格式的问题进行了增强。
由于 FQuAD 的许可证不允许共享数据,我们仅共享所使用的提示,以便用户可以以与 Muennighoff 等人的 xP3 数据集相同的格式自行重建数据集。
使用的提示
列表
该数据集创建了 24 个提示。逻辑上包括使用直陈式、使用“你”和“您”的形式。
plaintext
"+context+"
Générer une question à partir du texte ci-dessus : ,
"+context+"
Génère une question à partir du texte ci-dessus : ,
"+context+"
Générez une question à partir du texte ci-dessus : ,
"+context+"
Trouver une question à partir du texte ci-dessus : ,
"+context+"
Trouve une question à partir du texte ci-dessus : ,
"+context+"
Trouvez une question à partir du texte ci-dessus : ,
"+context+"
Créer une bonne question à partir du texte ci-dessus : ,
"+context+"
Crée trouver une bonne question à partir du texte ci-dessus : ,
"+context+"
Créez trouver une bonne question à partir du texte ci-dessus : ,
"+context+"
Ecrire une bonne question à partir du texte ci-dessus : ,
"+context+"
Ecris une bonne question à partir du texte ci-dessus : ,
"+context+"
Ecrivez une bonne question à partir du texte ci-dessus : ,
Générer une bonne question pour le texte suivant : "+context+",
Génère une bonne question pour le texte suivant : "+context+",
Générez une bonne question pour le texte suivant : "+context+",
Trouver une bonne question pour le texte suivant : "+context+",
Trouve une bonne question pour le texte suivant : "+context+",
Trouvez trouver une bonne question pour le texte suivant : "+context+",
Créer une bonne question pour le texte suivant : "+context+",
Crée trouver une bonne question pour le texte suivant : "+context+",
Créez trouver une bonne question pour le texte suivant : "+context+",
Ecrire une bonne question pour le texte suivant : "+context+",
Ecris une bonne question pour le texte suivant : "+context+",
Ecrivez une bonne question pour le texte suivant : "+context+"
分割
train包含 497,544 个样本valid包含 76,512 个样本- 没有测试集分割
许可证
CC BY-NC-SA 3.0



