five

CATIE-AQ/paws-x_fr_prompt_paraphrase_generation

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/paws-x_fr_prompt_paraphrase_generation
下载链接
链接失效反馈
官方服务:
资源简介:
paws-x_fr_prompt_paraphrase_generation数据集是法语提示数据集(DFP)的一个子集,专门用于释义生成任务。它包含了562,728行数据,这些数据来源于paws-x数据集的法语部分,并通过应用一系列提示来构建输入和目标列,以匹配xP3数据集的格式。数据集分为训练集、验证集和测试集,分别包含520,416、20,640和21,672个样本。

paws-x_fr_prompt_paraphrase_generation数据集是法语提示数据集(DFP)的一个子集,专门用于释义生成任务。它包含了562,728行数据,这些数据来源于paws-x数据集的法语部分,并通过应用一系列提示来构建输入和目标列,以匹配xP3数据集的格式。数据集分为训练集、验证集和测试集,分别包含520,416、20,640和21,672个样本。
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

数据集名称

paws-x_fr_prompt_paraphrase_generation

数据集来源

数据集大小

  • 包含562,728行数据。

数据集用途

  • 用于paraphrase generation任务。

数据集结构

  • train: 520,416 samples
  • valid: 20,640 samples
  • test: 21,672 samples

数据集特征

  • 使用24个提示构建输入和目标列,格式与xP3数据集相同。

语言

  • 该数据集为monolingual,仅包含French语言。

许可证

  • 许可证类型为other

引用信息

原始数据

@InProceedings{pawsx2019emnlp, title = {{PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification}}, author = {Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason}, booktitle = {Proc. of EMNLP}, year = {2019} }

本数据集

@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

许可证声明

  • 该数据集可自由使用,但建议承认Google LLC为数据来源。数据集按“原样”提供,不提供任何明示或暗示的保证。Google不对使用该数据集造成的任何直接或间接损害负责。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作