CATIE-AQ/taln-archives_fr_prompt_data_to_text
收藏数据集概述
基本信息
- 名称: taln-archives_fr_prompt_data_to_text
- 语言: 法语
- 许可证: CC-BY-4.0
- 数据规模: 10K<n<100K
- 任务类型: 文本生成
- 标签: data-to-text, DFP, french prompts
- 注释创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: taln-ls2n/taln-archives
摘要
taln-archives_fr_prompt_data_to_text 是 Dataset of French Prompts (DFP) 的一个子集。
包含 35,370 行数据,适用于数据到文本的任务。
原始数据(无提示)来自 taln-archives 数据集。
通过应用一系列提示(见下文)构建输入和目标列,以获得与 Muennighoff 等人的 xP3 数据集相同的格式。
提示列表
该数据集创建了 30 个提示,逻辑上包括直陈式、你称和您称形式。
plaintext
Assembler les concepts suivants pour former une phrase : "+concepts+".,
Assemble les concepts suivants pour former une phrase : "+concepts+".,
Assemblez les concepts suivants pour former une phrase : "+concepts+".,
Étant donné la liste des concepts : "+concepts+". Générer une phrase avec tous les concepts : ,
Étant donné la liste des concepts : "+concepts+". Génère une phrase avec tous les concepts : ,
Étant donné la liste des concepts : "+concepts+". Générez une phrase avec tous les concepts : ,
Convertir les concepts en une phrase : "+concepts+".,
Convertis les concepts en une phrase : "+concepts+".,
Convertissez les concepts en une phrase : "+concepts+".,
Combiner tous les concepts suivants dans un texte concis et grammaticalement correct "+concepts+". Texte : ,
Combine tous les concepts suivants dans un texte concis et grammaticalement correct "+concepts+". Texte : ,
Combinez tous les concepts suivants dans un texte concis et grammaticalement correct "+concepts+". Texte : ,
Générer une phrase à partir des informations fournies ci-contre : "+concepts+".,
Génère une phrase à partir des informations fournies ci-contre : "+concepts+".,
Générez une phrase à partir des informations fournies ci-contre : "+concepts+".,
Verbaliser les concepts suivants séparés par une virgule : "+concepts+".,
Verbalise les concepts suivants séparés par une virgule : "+concepts+".,
Verbalisez les concepts suivants séparés par une virgule : "+concepts+".,
Générer un texte intégrant les concepts suivants +concepts+". Texte :,
Génère un texte intégrant les concepts suivants +concepts+". Texte :,
Générez un texte intégrant les concepts suivants +concepts+". Texte :,
"+concepts+". Ecrire 1 à 5 phrases sur les concepts précédents.,
"+concepts+". Ecris 1 à 5 phrases sur les concepts précédents.,
"+concepts+". Ecrivez 1 à 5 phrases sur les concepts précédents.,
Rédiger un texte avec : "+concepts+".,
Rédige un texte avec : "+concepts+".,
Rédigez un texte avec : "+concepts+".,
Écrire un texte sur les concepts suivants : "+concepts+".,
Écris un texte sur les concepts suivants : "+concepts+".,
Écrivez un texte sur les concepts suivants : "+concepts+".,
数据分割
train: 35,370 样本- 无
valid分割 - 无
test分割
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/taln-archives_fr_prompt_data_to_text")
引用
原始数据
- (Boudin, 2013) Florian Boudin. 2013. TALN Archives : a digital archive of French research articles in Natural Language Processing (TALN Archives : une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue) [in French]. In Proceedings of TALN 2013 (Volume 2: Short Papers), pages 507–514, Les Sables d’Olonne, France. ATALA.
- (Boudin and Gallina, 2021) Florian Boudin and Ygor Gallina. 2021. Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 4185–4193, Online. Association for Computational Linguistics.
本数据集
plaintext
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可证
CC-BY-4.0



