five

maveriq/amazon_reviews_user_modeling

收藏
Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/maveriq/amazon_reviews_user_modeling
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个主要特征字段:评分(rating)、标题(title)、文本(text)、特征文本(feature_text)和父ASIN(parent_asin)。数据集分为三个部分:训练集(train)、测试集(test)和OOD验证集(ood_valid)。训练集包含4169个示例,测试集包含200个示例,OOD验证集包含3684个示例。数据集的下载大小为11948472字节,总大小为22528182.0字节。

The dataset contains four main feature fields: rating, title, text, feature_text, and parent_asin. The dataset is divided into three parts: train, test, and ood_valid. The train set contains 4169 examples, the test set contains 200 examples, and the ood_valid set contains 3684 examples. The download size of the dataset is 11948472 bytes, and the total size is 22528182.0 bytes.
提供机构:
maveriq
原始信息汇总

数据集概述

特征信息

  • rating: 类型为 float64
  • title: 类型为 string
  • text: 类型为 string
  • feature_text: 类型为 string
  • parent_asin: 类型为 string

数据分割

  • train: 包含 4169 个样本,大小为 7341540.29594873 字节
  • test: 包含 200 个样本,大小为 352196.7040512703 字节
  • ood_valid: 包含 3684 个样本,大小为 14834445 字节

数据集大小

  • 下载大小: 11948472 字节
  • 数据集总大小: 22528182.0 字节

配置信息

  • config_name: default
    • train: 路径为 data/train-*
    • test: 路径为 data/test-*
    • ood_valid: 路径为 data/ood_valid-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作