mteb/amazon_polarity

Name: mteb/amazon_polarity
Creator: mteb
Published: 2025-05-04 16:07:45
License: 暂无描述

Hugging Face2025-05-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mteb/amazon_polarity

下载链接

链接失效反馈

官方服务：

资源简介：

AmazonPolarityClassification数据集是一个用于文本分类任务的单一语言（英语）数据集。它包含来自亚马逊的评论数据，用于情感分析，包括情感评分、情感分类和仇恨言论检测等任务。数据集分为训练集和测试集，共有360万和40万条示例。每个示例都包括一个文本和一个标签，标签为整数类型，表示正面或负面情感。

The AmazonPolarityClassification dataset is a monolingual (English) dataset for text classification tasks. It contains review data from Amazon for sentiment analysis, including tasks such as sentiment scoring, sentiment classification, and hate speech detection. The dataset is split into a training set and a test set, with a total of 3.6 million and 400,000 examples respectively. Each example includes a text and a label, with the label being an integer type indicating positive or negative sentiment.

提供机构：

mteb

原始信息汇总

数据集语言信息

语言: 英语

搜集汇总

数据集介绍

构建方式

在情感分析领域，亚马逊评论数据集因其丰富的用户生成内容而备受关注。Amazon Polarity Classification数据集源自亚马逊平台上的商品评论，通过自动化流程从原始评论中提取文本内容，并依据用户评分衍生出情感极性标签。具体而言，该数据集将评分映射为二元分类标签，其中正面与负面评价各占一半，确保了类别平衡。数据经过清洗与标准化处理，移除了无关元数据，最终形成包含数百万条样本的大规模语料库，为文本分类任务提供了坚实基础。

特点

该数据集在文本分类任务中展现出显著特点。其规模庞大，涵盖超过四百万条评论，其中训练集包含三百六十万样本，测试集达四十万，足以支撑深度模型的训练与评估。所有文本均为英文，领域集中于商品评论，文本长度介于72至1015字符之间，平均长度约431字符，提供了充足的上下文信息。标签分布均衡，正面与负面情感样本数量严格一致，有效避免了类别偏差问题，提升了模型评估的可靠性。

使用方法

作为大规模文本嵌入基准（MTEB）的一部分，该数据集主要用于评估嵌入模型在情感分类任务上的性能。研究人员可通过MTEB框架便捷加载数据集与任务，使用标准接口对自定义模型进行自动化评估。典型流程包括导入mteb库、获取AmazonPolarityClassification任务实例，并调用评估器运行模型，从而获得分类准确率等指标。该集成化方法简化了基准测试流程，支持跨模型性能对比，推动了文本嵌入技术的迭代发展。

背景与挑战

背景概述

在自然语言处理领域，情感分析作为文本挖掘的核心任务，长期致力于从用户生成内容中自动识别情感倾向。亚马逊极性分类数据集（Amazon Polarity）由Julian McAuley和Jure Leskovec于2013年构建，源自亚马逊平台的海量商品评论，旨在探究评分维度与评论文本之间的隐含关联。该数据集作为大规模文本嵌入基准（MTEB）的重要组成部分，为情感分类、推荐系统及文本表示学习提供了关键的数据支撑，显著推动了基于深度学习的语义理解模型的发展。

当前挑战

情感分析任务面临的核心挑战在于准确捕捉文本中复杂、隐含的情感表达，尤其是面对讽刺、双重否定等微妙语言现象时，模型容易产生误判。在数据集构建过程中，挑战主要源于原始评论数据的噪声过滤与高质量标注的获取，需在保持数据规模的同时确保标签的准确性与一致性。此外，评论文本的长度与内容多样性也为模型的泛化能力提出了更高要求，需平衡数据分布的均衡性与现实场景的复杂性。

常用场景

经典使用场景

在情感分析领域，Amazon Polarity数据集作为大规模文本分类任务的基准，常被用于评估和比较不同文本嵌入模型的性能。该数据集包含数百万条亚马逊商品评论，每条评论被标注为正面或负面情感，为研究者提供了一个标准化的测试平台，用以检验模型在真实世界文本数据上的泛化能力和鲁棒性。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究，如McAuley等人利用隐因子模型探索评分与评论文本的关系。此外，MTEB和MMTEB等大规模文本嵌入基准项目将其纳入评估体系，推动了BERT、RoBERTa等预训练模型在情感分析任务上的性能优化与跨领域迁移研究。

数据集最近研究