Lots-of-LoRAs/task1311_amazonreview_rating_classification

Name: Lots-of-LoRAs/task1311_amazonreview_rating_classification
Creator: Lots-of-LoRAs
Published: 2024-07-16 13:59:44
License: 暂无描述

Hugging Face2024-07-16 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/Lots-of-LoRAs/task1311_amazonreview_rating_classification

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为task1311_amazonreview_rating_classification，主要用于亚马逊评论的评分分类任务。数据集包含训练集、验证集和测试集，分别有3640、455和455个样本。每个样本包含输入文本、输出文本和唯一标识符。数据集的语言为英语，创建者和注释者均为众包。数据集的相关信息可以在GitHub主页和两篇论文中找到。

The dataset, named task1311_amazonreview_rating_classification, is primarily used for the task of Amazon review rating classification. It includes training, validation, and test sets with 3640, 455, and 455 examples respectively. Each example contains input text, output text, and a unique identifier. The dataset is in English, with both creators and annotators being crowdsourced. More information about the dataset can be found on its GitHub homepage and in two related papers.

提供机构：

Lots-of-LoRAs

原始信息汇总

数据集概述

基本信息

数据集名称: task1311_amazonreview_rating_classification
任务类别: 文本生成
语言: 英语
许可证: Apache 2.0
数据创建者: 众包
注释创建者: 众包

数据集配置

配置名称: plain_text

特征

输入: 字符串
输出: 字符串
ID: 字符串

数据分割

训练集: 3640个样本
验证集: 455个样本
测试集: 455个样本

搜集汇总

数据集介绍

构建方式

在自然语言处理领域，情感分析任务一直是研究热点，而商品评论的评分分类则是其中一项具有广泛应用价值的子任务。该数据集源自Allen AI发布的Super-NaturalInstructions项目，专门针对亚马逊商品评论的评分进行分类。构建方式上，数据集通过众包（crowdsourced）方式收集了语言标注，确保数据来源的多样性与真实性。其任务设计遵循自然指令（Natural Instructions）范式，每条样本包含一个输入字段（input）和一个输出字段（output），分别对应评论文本和对应的评分类别。数据被划分为训练集（3640条）、验证集（455条）和测试集（455条），总计4550条样本，结构简洁清晰，便于直接用于文本生成任务的微调与评估。

特点

该数据集最显著的特点在于其面向文本生成任务的评分分类设计，将评论的评分预测转化为自然语言生成问题，而非传统的分类标签输出。这种设计使得模型能够更好地理解指令语义，提升泛化能力。数据集的标注完全依赖众包完成，确保了标注质量与真实场景的高度一致性。此外，数据集规模适中，训练集与验证集、测试集的比例约为8:1:1，既避免了过小的样本量导致模型欠拟合，又防止了过大数据集带来的训练负担。其任务定义明确，专注于亚马逊商品评论这一垂直领域，为电商场景下的情感分析研究提供了精准的基准测试资源。

使用方法

使用该数据集时，研究者可将其作为文本生成任务的训练与评测基准。具体而言，模型需根据给定的商品评论输入（input），生成对应的评分分类输出（output）。数据集的HuggingFace接口支持通过加载配置名'plain_text'直接获取数据，返回的字典包含input、output和id三个字段。用户可基于该格式构建数据加载器，使用预训练语言模型（如T5、GPT等）进行指令微调（instruction tuning）。由于数据集遵循Super-NaturalInstructions的标准格式，研究者也可将其与其他1600余个NLP任务数据集结合，构建多任务学习框架，以提升模型对自然指令的通用理解能力。

背景与挑战

背景概述

在自然语言处理领域，指令微调与多任务泛化能力的研究近年来备受关注，其中Super-NaturalInstructions数据集应运而生，由华盛顿大学、艾伦人工智能研究院等机构的研究人员于2022年提出，核心论文发表于arXiv（2204.07705）。该数据集汇集了1600余项自然语言处理任务，旨在探索模型通过声明式指令实现跨任务泛化的能力。作为其子任务之一，task1311_amazonreview_rating_classification聚焦于亚马逊商品评论的情感评级分类，通过众包方式构建了3640条训练样本、455条验证样本及455条测试样本，每条数据包含评论文本与对应的星级标签。该任务不仅为情感分析领域提供了标准化基准，更推动了模型在细粒度情感理解与用户生成内容分析方面的研究进展，对电商平台用户反馈挖掘、产品改进策略制定等实际应用具有重要参考价值。

当前挑战

该数据集面临的核心挑战体现在两个层面：其一，在领域问题层面，亚马逊评论评级分类需应对评论文本中隐含的复杂情感表达，如讽刺、双关或语境依赖的褒贬含义，传统基于关键词或简单情感词典的方法难以捕捉此类微妙语义，且不同用户对同一星级标准的理解存在主观差异，导致标签噪声与类间边界模糊；其二，在数据集构建过程中，众包标注的固有局限性带来一致性挑战，不同标注者对情感强度的判断标准可能偏离预设尺度，同时评论长度的极端分布（如短评缺乏上下文、长评包含冗余信息）增加了特征提取难度。此外，该任务作为Super-NaturalInstructions的子集，还需解决多任务指令泛化中的任务歧义性问题，即模型需准确理解“rating classification”这一指令的语义边界，避免与情感极性分析等相似任务产生混淆。

常用场景

经典使用场景

该数据集源自Amazon商品评论的文本内容与对应的星级评分，经典使用场景聚焦于文本分类任务，尤其是情感分析中的多类别情感极性判别。研究者利用评论的文本特征，训练模型以预测用户赋予的1至5星评分，从而实现对评论情感的细粒度量化。这一过程不仅检验了模型对自然语言中主观表达的理解能力，也为后续在更复杂的自然语言指令遵循任务中评估模型泛化性能奠定了坚实基础。

实际应用

在实际应用中，该数据集训练的模型被广泛部署于电商平台与客户反馈系统，用于自动分析海量商品评论的情感倾向。企业能够据此快速识别用户对产品的满意度分布、定位差评中的关键痛点，进而优化产品设计与服务策略。此外，该模型还能辅助推荐系统根据评论情感调整商品权重，提升用户体验与商业转化效率，成为现代电子商务中数据驱动的决策支持核心工具。

衍生相关工作

该数据集衍生出多项经典研究，最典型的是作为Super-NaturalInstructions基准任务之一，被用于评估大语言模型在遵循自然语言指令方面的泛化能力。后续工作如LoRA适配器压缩与高效服务研究（Compress then Serve），利用该任务验证了轻量化微调方法在多任务场景下的性能保持。此外，它还被整合进多任务学习框架中，推动了对指令微调中任务干扰与知识迁移机制的深入理解，成为自然语言处理领域指令学习范式的重要基石。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集