five

CATIE-AQ/french_book_reviews_fr_prompt_stars_classification

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/french_book_reviews_fr_prompt_stars_classification
下载链接
链接失效反馈
官方服务:
资源简介:
french_book_reviews_fr_prompt_stars_classification是法国提示数据集(DFP)的一个子集,包含270,424行数据,用于星级分类情感分析任务。数据来源于Eltaief的french_book_reviews数据集,并通过应用一系列提示来构建输入和目标列,以匹配xP3数据集的格式。数据集使用了22个不同的提示,这些提示以指示性语气、你形式(tutoiement)和您形式(vouvoiement)提出,用于生成输入和目标列。
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

数据集名称

french_book_reviews_fr_prompt_stars_classification

数据集来源

该数据集是Dataset of French Prompts (DFP)的一个子集,原始数据来自french_book_reviews

数据集大小

包含270,424条记录,属于100K<n<1M大小类别。

语言

数据集为法语(monolingual)。

任务类别

主要用于文本分类任务,特别是星级分类情感分析

数据集结构

  • 训练集:270,424样本
  • 无验证集
  • 无测试集

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/french_book_reviews_fr_prompt_stars_classification")

许可证

数据集遵循CC0: Public Domain许可证。

引用信息

原始数据

@misc {abir_eltaief_2023,
author = { {Abir ELTAIEF} },
title = { french_book_reviews (Revision 534725e) },
year = 2023,
url = { https://huggingface.co/datasets/Abirate/french_book_reviews },
doi = { 10.57967/hf/1052 },
publisher = { Hugging Face }}

本数据集

@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作