CATIE-AQ/wikinews-fr-100_fr_prompt_data_to_text
收藏wikinews-fr-100_fr_prompt_data_to_text 数据集概述
概要
wikinews-fr-100_fr_prompt_data_to_text 是 Dataset of French Prompts (DFP) 的一个子集。该数据集包含 3,000 条数据,适用于数据到文本的任务。原始数据(不含提示)来自 wikinews-fr-100 数据集。随后应用了一系列提示(见下文),以构建输入和目标列,从而获得与 Muennighoff 等人的 xP3 数据集相同的格式。
使用的提示
列表
该数据集创建了 30 个提示。这些提示的逻辑包括使用直陈式、使用“你”和“您”的形式。
plaintext
Assembler les concepts suivants pour former une phrase : "+concepts+".,
Assemble les concepts suivants pour former une phrase : "+concepts+".,
Assemblez les concepts suivants pour former une phrase : "+concepts+".,
Étant donné la liste des concepts : "+concepts+". Générer une phrase avec tous les concepts : ,
Étant donné la liste des concepts : "+concepts+". Génère une phrase avec tous les concepts : ,
Étant donné la liste des concepts : "+concepts+". Générez une phrase avec tous les concepts : ,
Convertir les concepts en une phrase : "+concepts+".,
Convertis les concepts en une phrase : "+concepts+".,
Convertissez les concepts en une phrase : "+concepts+".,
Combiner tous les concepts suivants dans un texte concis et grammaticalement correct "+concepts+". Texte : ,
Combine tous les concepts suivants dans un texte concis et grammaticalement correct "+concepts+". Texte : ,
Combinez tous les concepts suivants dans un texte concis et grammaticalement correct "+concepts+". Texte : ,
Générer une phrase à partir des informations fournies ci-contre : "+concepts+".,
Génère une phrase à partir des informations fournies ci-contre : "+concepts+".,
Générez une phrase à partir des informations fournies ci-contre : "+concepts+".,
Verbaliser les concepts suivants séparés par une virgule : "+concepts+".,
Verbalise les concepts suivants séparés par une virgule : "+concepts+".,
Verbalisez les concepts suivants séparés par une virgule : "+concepts+".,
Générer un texte intégrant les concepts suivants +concepts+". Texte :,
Génère un texte intégrant les concepts suivants +concepts+". Texte :,
Générez un texte intégrant les concepts suivants +concepts+". Texte :,
"+concepts+". Ecrire 1 à 5 phrases sur les concepts précédents.,
"+concepts+". Ecris 1 à 5 phrases sur les concepts précédents.,
"+concepts+". Ecrivez 1 à 5 phrases sur les concepts précédents.,
Rédiger un texte avec : "+concepts+".,
Rédige un texte avec : "+concepts+".,
Rédigez un texte avec : "+concepts+".,
Écrire un texte sur les concepts suivants : "+concepts+".,
Écris un texte sur les concepts suivants : "+concepts+".,
Écrivez un texte sur les concepts suivants : "+concepts+".,
数据集划分
train包含 3,000 个样本- 无
valid划分 - 无
test划分
如何使用
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/wikinews-fr-100_fr_prompt_data_to_text")
引用
原始数据
- (Boudin, 2013) Florian Boudin. 2013. TALN Archives : a digital archive of French research articles in Natural Language Processing (TALN Archives : une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue) [in French]. In Proceedings of TALN 2013 (Volume 2: Short Papers), pages 507–514, Les Sables d’Olonne, France. ATALA.
- (Boudin and Gallina, 2021) Florian Boudin and Ygor Gallina. 2021. Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 4185–4193, Online. Association for Computational Linguistics.
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可证
cc-by-4.0



