CATIE-AQ/french_book_reviews_fr_prompt_stars_classification
收藏数据集概述
数据集名称
french_book_reviews_fr_prompt_stars_classification
数据集来源
该数据集是Dataset of French Prompts (DFP)的一个子集,原始数据来自french_book_reviews。
数据集大小
包含270,424条记录,属于100K<n<1M大小类别。
语言
数据集为法语(monolingual)。
任务类别
主要用于文本分类任务,特别是星级分类情感分析。
数据集结构
- 训练集:270,424样本
- 无验证集
- 无测试集
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/french_book_reviews_fr_prompt_stars_classification")
许可证
数据集遵循CC0: Public Domain许可证。
引用信息
原始数据
@misc {abir_eltaief_2023,
author = { {Abir ELTAIEF} },
title = { french_book_reviews (Revision 534725e) },
year = 2023,
url = { https://huggingface.co/datasets/Abirate/french_book_reviews },
doi = { 10.57967/hf/1052 },
publisher = { Hugging Face }}
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}



