CATIE-AQ/piaf_fr_prompt_context_generation_with_question
收藏piaf_fr_prompt_context_generation_with_question 数据集概述
基本信息
- 语言: 法语
- 许可证: MIT
- 数据规模: 100K<n<1M
- 任务类别: 文本生成
- 标签: DFP, french prompts
- 注释创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: etalab-ia/piaf
数据集详情
- 名称: piaf_fr_prompt_context_generation_with_question
- 来源: 来自 Dataset of French Prompts (DFP) 的子集
- 数据量: 包含 442,752 行数据
- 任务类型: 上下文生成(包含问题和答案)
- 原始数据: 来自 PIAF 数据集,并增加了 FrenchQA 数据集中的 SQUAD 2.0 格式问题
- 格式: 通过应用一系列提示构建输入和目标列,格式与 xP3 数据集相同
提示列表
- 数量: 24 个提示
- 逻辑: 提示采用直陈式,使用 tutoiement 和 vouvoiement 形式
示例提示
Étant donné la question "+question+", écrire un texte explicatif.
Texte : ,
Étant donné la question "+question+", écris un texte explicatif.
Texte : ,
...
Créez un texte comme contexte à la question "+question+"
Texte :
数据分割
- 训练集: 442,752 样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/piaf_fr_prompt_context_generation_with_question")
引用
原始数据
@InProceedings{keraron-EtAl:2020:LREC, author = {Keraron, Rachel and Lancrenon, Guillaume and Bras, Mathilde and Allary, Frédéric and Moyse, Gilles and Scialom, Thomas and Soriano-Morales, Edmundo-Pavel and Staiano, Jacopo}, title = {Project PIAF: Building a Native French Question-Answering Dataset}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference}, month = {May}, year = {2020}, address = {Marseille, France}, publisher = {European Language Resources Association}, pages = {5483--5492}, url = {https://www.aclweb.org/anthology/2020.lrec-1.673} }
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可证
MIT



