defunct-datasets_amazon_reviews_multi
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/defunct-datasets_amazon_reviews_multi?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
Multilingual Amazon Reviews Corpus 提供了多语言文本分类能力,核心定位是亚马逊产品评论数据集,包含英语、日语、德语、法语、中文和西班牙语的评论。数据规模上,每种语言的训练集包含20万条评论,验证集和测试集各包含5000条评论。标注信息包括评论文本、评论标题、星级评分、匿名评论者ID、匿名产品ID和粗粒度的产品类别。数据来源于亚马逊的客户评论,经过语言检测算法处理,确保语言的准确性。该语料库适用于情感分析、文本生成、文本分类等多项任务。数据集遵循特定的非商业研究许可协议,禁止与个人信息关联或进行商业用途。
提供机构:
AIWizards
创建时间:
2024-07-19



