five

CATIE-AQ/amazon_reviews_multi_fr_prompt_sentiment_analysis

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/amazon_reviews_multi_fr_prompt_sentiment_analysis
下载链接
链接失效反馈
官方服务:
资源简介:
amazon_reviews_multi_fr_prompt_sentiment_analysis是一个适用于二分类情感分析任务的数据集,包含5878000条法国亚马逊评论数据,分为训练集、验证集和测试集。数据集通过应用28种不同的提示语来构建,这些提示语旨在引导用户对评论进行情感判断。

amazon_reviews_multi_fr_prompt_sentiment_analysis is a dataset for binary sentiment analysis tasks, containing 5,880,000 French Amazon review entries, split into training, validation, and test sets. The dataset is constructed by applying 28 different prompts to guide sentiment judgments on the reviews.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

数据集名称: amazon_reviews_multi_fr_prompt_sentiment_analysis
数据集来源: 该数据集是Dataset of French Prompts (DFP)的一个子集,原始数据来自amazon_reviews_multi

数据集内容

  • 数据量: 包含5,880,000行数据。
  • 任务类型: 二元情感分析。
  • 语言: 法语。
  • 数据结构: 通过应用28个提示构建输入和目标列,格式与xP3数据集相同。

数据集特征

  • 提示特征: 使用reviewtargets构建,其中review来自原始数据集的review_bodytargets根据stars评分确定为"neg"或"pos"。

数据集分割

  • 训练集: 5,600,000样本
  • 验证集: 140,000样本
  • 测试集: 140,000样本

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/amazon_reviews_multi_fr_prompt_sentiment_analysis")

许可证

该数据集受亚马逊自有协议限制,仅允许非商业研究使用。详细许可信息可访问此处

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作