Ruqiya/Arabic_Reviews_of_SHEIN
收藏Hugging Face2024-06-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Ruqiya/Arabic_Reviews_of_SHEIN
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含SHEIN在线商店的阿拉伯语产品评论,涵盖了产品的多个方面和整体客户满意度。收集此数据集的目的是为了包含日常对话中使用的广泛短语和术语,反映阿拉伯语言方言的多样性,特别是在沙特阿拉伯。数据集的列包括raw_text(客户撰写的评论文本),text(去除表情符号和重复字符的评论文本),以及label(客户给出的产品满意度评分)。
该数据集包含SHEIN在线商店的阿拉伯语产品评论,涵盖了产品的多个方面和整体客户满意度。收集此数据集的目的是为了包含日常对话中使用的广泛短语和术语,反映阿拉伯语言方言的多样性,特别是在沙特阿拉伯。数据集的列包括raw_text(客户撰写的评论文本),text(去除表情符号和重复字符的评论文本),以及label(客户给出的产品满意度评分)。
提供机构:
Ruqiya
原始信息汇总
数据集概述
基本信息
- 名称: Arabic Reviews of SHEIN Online Store
- 语言: 阿拉伯语
- 许可: Apache-2.0
数据集大小
- 类别: 1K<n<10K
任务类别
- 文本分类
- 文本到文本生成
- 文本生成
- 句子相似度
- 零样本分类
数据集特征
- text: 字符串类型,从原始评论文本中移除了表情符号和重复字符。
- raw_text: 字符串类型,客户撰写的原始评论文本。
- label: 整数类型,客户给出的产品满意度评分。
数据分割
- 训练集:
- 大小: 514231字节
- 示例数量: 2415
- 下载大小: 240066字节
- 数据集大小: 514231字节
配置
- 默认配置:
- 数据文件:
- 分割: 训练
- 路径: data/train-*
- 数据文件:
数据集目标
收集此数据集的目的是包含日常对话中使用的广泛短语和术语,反映阿拉伯语方言的多样性,特别是在沙特阿拉伯。



