gunnybd01/AmazonTextCls
收藏Hugging Face2026-02-26 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/gunnybd01/AmazonTextCls
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: main_category
dtype: string
- name: store
dtype: string
- name: title
dtype: string
- name: average_rating
dtype: float64
- name: rating_number
dtype: int64
- name: features
list: string
- name: description
list: string
- name: price
dtype: float64
- name: product_text
dtype: string
- name: id_category
dtype: int64
- name: class_id
dtype: int64
splits:
- name: bin_10pow5_group_0
num_bytes: 57352714
num_examples: 19500
- name: bin_10pow5_group_1
num_bytes: 58722183
num_examples: 19500
- name: bin_10pow4_group_2
num_bytes: 55872459
num_examples: 19500
- name: bin_10pow4_group_3
num_bytes: 51870241
num_examples: 19500
- name: bin_10pow3_group_4
num_bytes: 50203493
num_examples: 19500
- name: bin_10pow3_group_5
num_bytes: 37274560
num_examples: 14917
- name: merged_small_bins
num_bytes: 18710132
num_examples: 7003
download_size: 189312245
dataset_size: 330005782
configs:
- config_name: default
data_files:
- split: bin_10pow5_group_0
path: data/bin_10pow5_group_0-*
- split: bin_10pow5_group_1
path: data/bin_10pow5_group_1-*
- split: bin_10pow4_group_2
path: data/bin_10pow4_group_2-*
- split: bin_10pow4_group_3
path: data/bin_10pow4_group_3-*
- split: bin_10pow3_group_4
path: data/bin_10pow3_group_4-*
- split: bin_10pow3_group_5
path: data/bin_10pow3_group_5-*
- split: merged_small_bins
path: data/merged_small_bins-*
---
数据集信息:
特征项:
- 主类别(main_category):数据类型为字符串
- 店铺(store):数据类型为字符串
- 商品标题(title):数据类型为字符串
- 平均评分(average_rating):数据类型为float64
- 评分数量(rating_number):数据类型为int64
- 商品特性(features):数据类型为字符串列表
- 商品描述(description):数据类型为字符串列表
- 商品价格(price):数据类型为float64
- 商品文本(product_text):数据类型为字符串
- 类别ID(id_category):数据类型为int64
- 分类ID(class_id):数据类型为int64
数据集划分:
- 划分集:bin_10pow5_group_0,字节大小:57352714,样本数量:19500
- 划分集:bin_10pow5_group_1,字节大小:58722183,样本数量:19500
- 划分集:bin_10pow4_group_2,字节大小:55872459,样本数量:19500
- 划分集:bin_10pow4_group_3,字节大小:51870241,样本数量:19500
- 划分集:bin_10pow3_group_4,字节大小:50203493,样本数量:19500
- 划分集:bin_10pow3_group_5,字节大小:37274560,样本数量:14917
- 划分集:merged_small_bins,字节大小:18710132,样本数量:7003
总下载大小:189312245字节,总数据集大小:330005782字节
配置项:
- 配置名称:default,数据文件:
- 划分集bin_10pow5_group_0:文件路径为data/bin_10pow5_group_0-*
- 划分集bin_10pow5_group_1:文件路径为data/bin_10pow5_group_1-*
- 划分集bin_10pow4_group_2:文件路径为data/bin_10pow4_group_2-*
- 划分集bin_10pow4_group_3:文件路径为data/bin_10pow4_group_3-*
- 划分集bin_10pow3_group_4:文件路径为data/bin_10pow3_group_4-*
- 划分集bin_10pow3_group_5:文件路径为data/bin_10pow3_group_5-*
- 划分集merged_small_bins:文件路径为data/merged_small_bins-*
提供机构:
gunnybd01



