CATIE-AQ/piaf_fr_prompt_question_generation_with_answer_and_context
收藏数据集概述
基本信息
- 名称: piaf_fr_prompt_question_generation_with_answer_and_context
- 语言: 法语
- 许可证: MIT
- 数据量: 100K<n<1M
- 任务类别: 文本生成
- 标签: DFP, french prompts
- 注释创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: etalab-ia/piaf
详细描述
- 数据集来源: 该数据集是 Dataset of French Prompts (DFP) 的一个子集。
- 数据量: 包含 387,408 行数据,适用于问题生成(带答案和上下文)任务。
- 原始数据: 原始数据来自 PIAF 数据集,并通过 FrenchQA 数据集中的 SQUAD 2.0 格式问题进行了增强。
- 输入和目标列: 通过应用一系列提示构建了输入和目标列,格式与 xP3 数据集相同。
提示列表
- 数量: 21 个提示
- 逻辑: 提示采用直陈式,包括 tutoiement 和 vouvoiement 形式。
- 示例: plaintext Déterminer la question qui aurait pu être posée pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Détermine la question que tu aurais pu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Déterminez la question que vous auriez pu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Quelle question aurait pu être posée pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Quelle question aurais-tu pu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Quelle question auriez-vous pu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Quelle question peut être posée pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Quelle question peux-tu poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Quelle question pouvez-vous poser pour obtenir la réponse suivante dans le contexte donné. Contexte : "+context+"; Réponse : "+answer+"; Question :, Sachant la réponse suivante : "+answer+" Générer une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Génère une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Générez une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Trouver une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Trouves une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Trouvez une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Créer une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Crée trouver une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Créez trouver une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Ecrire une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Ecris une bonne question pour le texte suivant : "+context+", Sachant la réponse suivante : "+answer+" Ecrivez une bonne question pour le texte suivant : "+context+"
数据集分割
- 训练集: 387,408 样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/piaf_fr_prompt_question_generation_with_answer_and_context")
引用
原始数据
plaintext @InProceedings{keraron-EtAl:2020:LREC, author = {Keraron, Rachel and Lancrenon, Guillaume and Bras, Mathilde and Allary, Frédéric and Moyse, Gilles and Scialom, Thomas and Soriano-Morales, Edmundo-Pavel and Staiano, Jacopo}, title = {Project PIAF: Building a Native French Question-Answering Dataset}, booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference}, month = {May}, year = {2020}, address = {Marseille, France}, publisher = {European Language Resources Association}, pages = {5483--5492}, url = {https://www.aclweb.org/anthology/2020.lrec-1.673} }
当前数据集
plaintext @misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023, author = { {Centre Aquitain des Technologies de lInformation et Electroniques} }, title = { DFP (Revision 1d24c09) }, year = 2023, url = { https://huggingface.co/datasets/CATIE-AQ/DFP }, doi = { 10.57967/hf/1200 }, publisher = { Hugging Face } }
许可证
MIT



