five

mesmalif/amazon-shoe-reviews

收藏
Hugging Face2023-02-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mesmalif/amazon-shoe-reviews
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: marketplace dtype: string - name: customer_id dtype: string - name: review_id dtype: string - name: product_id dtype: string - name: product_parent dtype: string - name: product_title dtype: string - name: product_category dtype: string - name: labels dtype: int64 - name: helpful_votes dtype: int64 - name: total_votes dtype: int64 - name: vine dtype: int64 - name: verified_purchase dtype: int64 - name: review_headline dtype: string - name: text dtype: string - name: review_date dtype: string splits: - name: train num_bytes: 34784832.6 num_examples: 90000 - name: test num_bytes: 3864981.4 num_examples: 10000 download_size: 21283157 dataset_size: 38649814.0 --- # Dataset Card for "amazon-shoe-reviews" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息(dataset_info): 特征列表: - 名称:市场(marketplace),数据类型:字符串 - 名称:客户ID(customer_id),数据类型:字符串 - 名称:评论ID(review_id),数据类型:字符串 - 名称:商品ID(product_id),数据类型:字符串 - 名称:商品父ID(product_parent),数据类型:字符串 - 名称:商品标题(product_title),数据类型:字符串 - 名称:商品类别(product_category),数据类型:字符串 - 名称:标签(labels),数据类型:64位整数(int64) - 名称:有用投票数(helpful_votes),数据类型:64位整数 - 名称:总投票数(total_votes),数据类型:64位整数 - 名称:Vine计划参与标识(vine),数据类型:64位整数 - 名称:验证购买标识(verified_purchase),数据类型:64位整数 - 名称:评论标题(review_headline),数据类型:字符串 - 名称:评论正文(text),数据类型:字符串 - 名称:评论日期(review_date),数据类型:字符串 数据拆分: - 名称:训练集(train),占用字节数:34784832.6,样本数:90000 - 名称:测试集(test),占用字节数:3864981.4,样本数:10000 下载大小:21283157 数据集总大小:38649814.0 --- # 「亚马逊鞋类评论」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
mesmalif
原始信息汇总

数据集概述

数据集名称

  • 名称: amazon-shoe-reviews

数据集特征

  • 特征列表:
    • marketplace: string
    • customer_id: string
    • review_id: string
    • product_id: string
    • product_parent: string
    • product_title: string
    • product_category: string
    • labels: int64
    • helpful_votes: int64
    • total_votes: int64
    • vine: int64
    • verified_purchase: int64
    • review_headline: string
    • text: string
    • review_date: string

数据集分割

  • 训练集:
    • 数据量: 34784832.6 bytes
    • 样本数: 90000
  • 测试集:
    • 数据量: 3864981.4 bytes
    • 样本数: 10000

数据集大小

  • 下载大小: 21283157 bytes
  • 总数据集大小: 38649814.0 bytes
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作