mesmalif/amazon-shoe-reviews
收藏Hugging Face2023-02-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mesmalif/amazon-shoe-reviews
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: marketplace
dtype: string
- name: customer_id
dtype: string
- name: review_id
dtype: string
- name: product_id
dtype: string
- name: product_parent
dtype: string
- name: product_title
dtype: string
- name: product_category
dtype: string
- name: labels
dtype: int64
- name: helpful_votes
dtype: int64
- name: total_votes
dtype: int64
- name: vine
dtype: int64
- name: verified_purchase
dtype: int64
- name: review_headline
dtype: string
- name: text
dtype: string
- name: review_date
dtype: string
splits:
- name: train
num_bytes: 34784832.6
num_examples: 90000
- name: test
num_bytes: 3864981.4
num_examples: 10000
download_size: 21283157
dataset_size: 38649814.0
---
# Dataset Card for "amazon-shoe-reviews"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息(dataset_info):
特征列表:
- 名称:市场(marketplace),数据类型:字符串
- 名称:客户ID(customer_id),数据类型:字符串
- 名称:评论ID(review_id),数据类型:字符串
- 名称:商品ID(product_id),数据类型:字符串
- 名称:商品父ID(product_parent),数据类型:字符串
- 名称:商品标题(product_title),数据类型:字符串
- 名称:商品类别(product_category),数据类型:字符串
- 名称:标签(labels),数据类型:64位整数(int64)
- 名称:有用投票数(helpful_votes),数据类型:64位整数
- 名称:总投票数(total_votes),数据类型:64位整数
- 名称:Vine计划参与标识(vine),数据类型:64位整数
- 名称:验证购买标识(verified_purchase),数据类型:64位整数
- 名称:评论标题(review_headline),数据类型:字符串
- 名称:评论正文(text),数据类型:字符串
- 名称:评论日期(review_date),数据类型:字符串
数据拆分:
- 名称:训练集(train),占用字节数:34784832.6,样本数:90000
- 名称:测试集(test),占用字节数:3864981.4,样本数:10000
下载大小:21283157
数据集总大小:38649814.0
---
# 「亚马逊鞋类评论」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
mesmalif
原始信息汇总
数据集概述
数据集名称
- 名称: amazon-shoe-reviews
数据集特征
- 特征列表:
- marketplace: string
- customer_id: string
- review_id: string
- product_id: string
- product_parent: string
- product_title: string
- product_category: string
- labels: int64
- helpful_votes: int64
- total_votes: int64
- vine: int64
- verified_purchase: int64
- review_headline: string
- text: string
- review_date: string
数据集分割
- 训练集:
- 数据量: 34784832.6 bytes
- 样本数: 90000
- 测试集:
- 数据量: 3864981.4 bytes
- 样本数: 10000
数据集大小
- 下载大小: 21283157 bytes
- 总数据集大小: 38649814.0 bytes



