CATIE-AQ/termith-eval_fr_prompt_data_to_text
收藏termith-eval_fr_prompt_data_to_text 数据集概述
基本信息
- 语言: 法语
- 许可: CC-BY-4.0
- 数据规模: 10K<n<100K
- 任务类别: 文本生成
- 标签: data-to-text, DFP, french prompts
- 标注创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: taln-ls2n/termith-eval
数据集详情
- 名称: termith-eval_fr_prompt_data_to_text
- 来源: Dataset of French Prompts (DFP) 的子集
- 数据量: 11,886 条记录
- 原始数据: termith-eval
- 格式: 与 xP3 数据集格式相同
提示列表
- 数量: 30 个提示
- 逻辑: 使用直陈式、第二人称单数和第二人称复数形式
示例提示
Assembler les concepts suivants pour former une phrase : "+concepts+".,
Assemble les concepts suivants pour former une phrase : "+concepts+".,
Assemblez les concepts suivants pour former une phrase : "+concepts+".,
...
Écrivez un texte sur les concepts suivants : "+concepts+".,
数据集划分
- 训练集: 11,886 条样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/termith-eval_fr_prompt_data_to_text")
引用
原始数据
- (Boudin, 2013) Florian Boudin. 2013. [TALN Archives : a digital archive of French research articles in Natural Language Processing (TALN Archives : une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue) [in French]][boudin-2013]. In Proceedings of TALN 2013 (Volume 2: Short Papers), pages 507–514, Les Sables d’Olonne, France. ATALA.
- (Boudin and Gallina, 2021) Florian Boudin and Ygor Gallina. 2021. [Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness][boudin-2021]. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 4185–4193, Online. Association for Computational Linguistics.
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可
CC-BY-4.0



