five

CATIE-AQ/piaf_fr_prompt_context_generation_with_question

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/piaf_fr_prompt_context_generation_with_question
下载链接
链接失效反馈
官方服务:
资源简介:
piaf_fr_prompt_context_generation_with_question数据集是DFP数据集的一个子集,包含442,752行数据,用于上下文生成任务(带有答案和问题)。原始数据来自PIAF数据集,并通过FrenchQA数据集中的SQUAD 2.0格式的问题进行了增强。使用了24种提示来构建输入和目标列,以匹配xP3数据集的格式。数据集仅包含训练集,没有验证集和测试集。
提供机构:
CATIE-AQ
原始信息汇总

piaf_fr_prompt_context_generation_with_question 数据集概述

基本信息

  • 语言: 法语
  • 许可证: MIT
  • 数据规模: 100K<n<1M
  • 任务类别: 文本生成
  • 标签: DFP, french prompts
  • 注释创建者: found
  • 语言创建者: found
  • 多语言性: 单语种
  • 源数据集: etalab-ia/piaf

数据集详情

  • 名称: piaf_fr_prompt_context_generation_with_question
  • 来源: 来自 Dataset of French Prompts (DFP) 的子集
  • 数据量: 包含 442,752 行数据
  • 任务类型: 上下文生成(包含问题和答案)
  • 原始数据: 来自 PIAF 数据集,并增加了 FrenchQA 数据集中的 SQUAD 2.0 格式问题
  • 格式: 通过应用一系列提示构建输入和目标列,格式与 xP3 数据集相同

提示列表

  • 数量: 24 个提示
  • 逻辑: 提示采用直陈式,使用 tutoiement 和 vouvoiement 形式

示例提示

Étant donné la question "+question+", écrire un texte explicatif. Texte : ,
Étant donné la question "+question+", écris un texte explicatif. Texte : ,
... Créez un texte comme contexte à la question "+question+" Texte :

数据分割

  • 训练集: 442,752 样本
  • 验证集: 无
  • 测试集: 无

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/piaf_fr_prompt_context_generation_with_question")

引用

原始数据

@InProceedings{keraron-EtAl:2020:LREC, author = {Keraron, Rachel and Lancrenon, Guillaume and Bras, Mathilde and Allary, Frédéric and Moyse, Gilles and Scialom, Thomas and Soriano-Morales, Edmundo-Pavel and Staiano, Jacopo}, title = {Project PIAF: Building a Native French Question-Answering Dataset}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference}, month = {May}, year = {2020}, address = {Marseille, France}, publisher = {European Language Resources Association}, pages = {5483--5492}, url = {https://www.aclweb.org/anthology/2020.lrec-1.673} }

本数据集

@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

许可证

MIT

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作