maveriq/amazon_reviews_user_modeling
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/maveriq/amazon_reviews_user_modeling
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征字段:评分(rating)、标题(title)、文本(text)、特征文本(feature_text)和父ASIN(parent_asin)。数据集分为三个部分:训练集(train)、测试集(test)和OOD验证集(ood_valid)。训练集包含4169个示例,测试集包含200个示例,OOD验证集包含3684个示例。数据集的下载大小为11948472字节,总大小为22528182.0字节。
The dataset contains four main feature fields: rating, title, text, feature_text, and parent_asin. The dataset is divided into three parts: train, test, and ood_valid. The train set contains 4169 examples, the test set contains 200 examples, and the ood_valid set contains 3684 examples. The download size of the dataset is 11948472 bytes, and the total size is 22528182.0 bytes.
提供机构:
maveriq
原始信息汇总
数据集概述
特征信息
- rating: 类型为
float64 - title: 类型为
string - text: 类型为
string - feature_text: 类型为
string - parent_asin: 类型为
string
数据分割
- train: 包含 4169 个样本,大小为 7341540.29594873 字节
- test: 包含 200 个样本,大小为 352196.7040512703 字节
- ood_valid: 包含 3684 个样本,大小为 14834445 字节
数据集大小
- 下载大小: 11948472 字节
- 数据集总大小: 22528182.0 字节
配置信息
- config_name: default
- train: 路径为
data/train-* - test: 路径为
data/test-* - ood_valid: 路径为
data/ood_valid-*
- train: 路径为



