CATIE-AQ/piaf_fr_prompt_context_generation_with_answer_and_question
收藏数据集概述
基本信息
- 语言: 法语
- 许可证: MIT
- 数据规模: 100K<n<1M
- 任务类别: 文本生成
- 标签: DFP, french prompts
- 标注创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: etalab-ia/piaf
数据集详情
- 名称: piaf_fr_prompt_context_generation_with_answer_and_question
- 概述: 该数据集是Dataset of French Prompts (DFP)的一个子集,包含442,752行数据,适用于上下文生成(带答案和问题)任务。原始数据来自PIAF数据集,并通过FrenchQA数据集中的SQUAD 2.0格式问题进行了增强。通过应用一系列提示,构建了输入和目标列,以获得与xP3数据集相同的格式。
提示列表
-
数量: 24个
-
逻辑: 提示采用直陈式,使用“你”和“您”的形式。
-
示例:
Étant donné la réponse "+ answer+" à la question "+question+", écrire un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", écris un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", écrivez un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", rédiger un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", rédige un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", rédigez un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", générer un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", génère un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", générez un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", créer un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", crée un texte explicatif. Texte : , Étant donné la réponse "+ answer+" à la question "+question+", créez un texte explicatif. Texte : , Ecrire un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Ecris un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Ecrivez un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Rédiger un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Rédige un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Rédigez un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Générer un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Génère un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Générez un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Créer un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Crée un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte : , Créez un texte comme contexte de la réponse "+ answer+" à la question "+question+" Texte :
数据分割
- 训练集: 442,752个样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/piaf_fr_prompt_context_generation_with_answer_and_question")
引用
原始数据
@InProceedings{keraron-EtAl:2020:LREC, author = {Keraron, Rachel and Lancrenon, Guillaume and Bras, Mathilde and Allary, Frédéric and Moyse, Gilles and Scialom, Thomas and Soriano-Morales, Edmundo-Pavel and Staiano, Jacopo}, title = {Project PIAF: Building a Native French Question-Answering Dataset}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference}, month = {May}, year = {2020}, address = {Marseille, France}, publisher = {European Language Resources Association}, pages = {5483--5492}, url = {https://www.aclweb.org/anthology/2020.lrec-1.673} }
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023, author = { {Centre Aquitain des Technologies de lInformation et Electroniques} }, title = { DFP (Revision 1d24c09) }, year = 2023, url = { https://huggingface.co/datasets/CATIE-AQ/DFP }, doi = { 10.57967/hf/1200 }, publisher = { Hugging Face } }
许可证
MIT



