five

CATIE-AQ/newsquadfr_fr_prompt_question_generation_with_answer

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/newsquadfr_fr_prompt_question_generation_with_answer
下载链接
链接失效反馈
官方服务:
资源简介:
newsquadfr_fr_prompt_question_generation_with_answer数据集是法语提示数据集(DFP)的一个子集,包含92,620行数据,用于生成带有答案的问题。原始数据来自newsquadfr数据集,并通过FrenchQA数据集中的SQUAD 2.0格式的问题进行了增强。使用了22种不同的提示来构建输入和目标列,以匹配xP3数据集的格式。数据集分为训练集和验证集,没有测试集。
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

基本信息

  • 语言: 法语
  • 许可证: CC BY-NC-SA 4.0
  • 数据规模: 10K<n<100K
  • 任务类别: 文本生成
  • 标签: DFP, french prompts
  • 注释创建者: found
  • 语言创建者: found
  • 多语言性: 单语种
  • 源数据集: newsquadfr

数据集详情

  • 名称: newsquadfr_fr_prompt_question_generation_with_answer
  • 来源: 是 Dataset of French Prompts (DFP) 的一个子集
  • 数据量: 包含 92,620 行数据,适用于问题生成(带答案)任务
  • 原始数据: 来自 newsquadfr 数据集,并通过 FrenchQA 数据集中的问题以 SQUAD 2.0 格式进行了增强
  • 输入输出格式: 通过应用一系列提示构建了输入和目标列,以获得与 xP3 数据集相同的格式

提示列表

  • 数量: 22 个提示

  • 逻辑: 提示采用直陈式,包括 tutoiement 和 vouvoiement 形式

  • 示例:

    Quelle question donnerait la réponse suivante ? Réponse : "+answer+"; Question :, Déterminer la question qui aurait pu être posée pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Détermine la question que tu aurais pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Déterminez la question que vous auriez pu poser pour obtenir la réponse suivante . Réponse : "+answer+"; Question :, Quelle question aurait pu être posée pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Quelle question aurais-tu pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Quelle question auriez-vous pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Quelle question aurait pu être posée pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Quelle question aurais-tu pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Quelle question auriez-vous pu poser pour obtenir la réponse suivante. Réponse : "+answer+"; Question :, Sachant la réponse suivante : "+answer+" Générer une bonne question : , Sachant la réponse suivante : "+answer+" Génère une bonne question : , Sachant la réponse suivante : "+answer+" Générez une bonne question : , Sachant la réponse suivante : "+answer+" Trouver une bonne question : , Sachant la réponse suivante : "+answer+" Trouves une bonne question : , Sachant la réponse suivante : "+answer+" Trouvez une bonne question : , Sachant la réponse suivante : "+answer+" Créer une bonne question : , Sachant la réponse suivante : "+answer+" Crée trouver une bonne question : , Sachant la réponse suivante : "+answer+" Créez trouver une bonne question : , Sachant la réponse suivante : "+answer+" Ecrire une bonne question : , Sachant la réponse suivante : "+answer+" Ecris une bonne question : , Sachant la réponse suivante : "+answer+" Ecrivez une bonne question

数据分割

  • 训练集: 72,600 样本
  • 验证集: 20,000 样本
  • 测试集: 无

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/newsquadfr_fr_prompt_question_generation_with_answer")

引用

原始数据

Hugging Face repository: https://huggingface.co/datasets/lincoln/newsquadfr

本数据集

@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

许可证

CC BY-NC-SA 4.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作