CATIE-AQ/french_book_reviews_fr_prompt_sentiment_analysis
收藏数据集概述
基本信息
- 名称: french_book_reviews_fr_prompt_sentiment_analysis
- 语言: 法语
- 许可: CC
- 大小: 100K<n<1M
- 任务类别: 文本分类
- 标签: 二元情感分析, DFP, 法语提示
- 注释创建者: found
- 语言创建者: found
- 多语言性: 单语
- 源数据集: french_book_reviews
详细描述
- 数据集来源: 该数据集是 Dataset of French Prompts (DFP) 的一个子集。
- 数据量: 包含 270,424 条数据,适用于二元情感分析任务。
- 原始数据: 原始数据来自 Eltaief 的 french_book_reviews 数据集。
- 提示列表: 该数据集使用了 28 个提示,这些提示以直陈式、第二人称单数和第二人称复数形式呈现。
提示特征
- 提示构造: 提示列表中的
review和targets是从以下代码构造的: python fbr = load_dataset(Abirate/french_book_reviews) review = fbr[train][reader_review][i] if fbr[train][rating][i] < 2.5: targets.append("neg") else : targets.append("pos")
数据集划分
- 训练集: 270,424 条样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/french_book_reviews_fr_prompt_sentiment_analysis")
引用
原始数据
@misc {abir_eltaief_2023,
author = { {Abir ELTAIEF} },
title = { french_book_reviews (Revision 534725e) },
year = 2023,
url = { https://huggingface.co/datasets/Abirate/french_book_reviews },
doi = { 10.57967/hf/1052 },
publisher = { Hugging Face }}
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}



