five

CATIE-AQ/termith-eval_fr_prompt_data_to_text

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/termith-eval_fr_prompt_data_to_text
下载链接
链接失效反馈
官方服务:
资源简介:
termith-eval_fr_prompt_data_to_text数据集是从法语提示数据集(DFP)中提取的一个子集,包含11,886行数据,适用于数据到文本的任务。原始数据来自termith-eval数据集,通过应用30个不同的提示来构建输入和目标列,格式与xP3数据集相同。数据集的划分只有训练集,没有验证集和测试集。
提供机构:
CATIE-AQ
原始信息汇总

termith-eval_fr_prompt_data_to_text 数据集概述

基本信息

  • 语言: 法语
  • 许可: CC-BY-4.0
  • 数据规模: 10K<n<100K
  • 任务类别: 文本生成
  • 标签: data-to-text, DFP, french prompts
  • 标注创建者: found
  • 语言创建者: found
  • 多语言性: 单语种
  • 源数据集: taln-ls2n/termith-eval

数据集详情

提示列表

  • 数量: 30 个提示
  • 逻辑: 使用直陈式、第二人称单数和第二人称复数形式

示例提示

Assembler les concepts suivants pour former une phrase : "+concepts+".,
Assemble les concepts suivants pour former une phrase : "+concepts+".,
Assemblez les concepts suivants pour former une phrase : "+concepts+".,
... Écrivez un texte sur les concepts suivants : "+concepts+".,

数据集划分

  • 训练集: 11,886 条样本
  • 验证集: 无
  • 测试集: 无

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/termith-eval_fr_prompt_data_to_text")

引用

原始数据

  • (Boudin, 2013) Florian Boudin. 2013. [TALN Archives : a digital archive of French research articles in Natural Language Processing (TALN Archives : une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue) [in French]][boudin-2013]. In Proceedings of TALN 2013 (Volume 2: Short Papers), pages 507–514, Les Sables d’Olonne, France. ATALA.
  • (Boudin and Gallina, 2021) Florian Boudin and Ygor Gallina. 2021. [Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness][boudin-2021]. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 4185–4193, Online. Association for Computational Linguistics.

本数据集

@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

许可

CC-BY-4.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作