DukeNLPGroup/movielens-100k
收藏Hugging Face2025-11-15 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/DukeNLPGroup/movielens-100k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: bucketized_user_age
dtype: float32
- name: movie_genres
list: int64
- name: movie_id
dtype: binary
- name: movie_title
dtype: string
- name: raw_user_age
dtype: float32
- name: timestamp
dtype: int64
- name: user_gender
dtype: bool
- name: user_id
dtype: binary
- name: user_occupation_label
dtype: int64
- name: user_occupation_text
dtype: string
- name: user_rating
dtype: float32
- name: user_zip_code
dtype: string
splits:
- name: train
num_bytes: 11081663
num_examples: 100000
download_size: 1481407
dataset_size: 11081663
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征列表:
- 特征名:分箱用户年龄(bucketized_user_age),数据类型:32位浮点型(float32)
- 特征名:电影流派(movie_genres),数据类型:64位整型列表(list<int64>)
- 特征名:电影ID(movie_id),数据类型:二进制类型(binary)
- 特征名:电影标题(movie_title),数据类型:字符串型(string)
- 特征名:原始用户年龄(raw_user_age),数据类型:32位浮点型(float32)
- 特征名:时间戳(timestamp),数据类型:64位整型(int64)
- 特征名:用户性别(user_gender),数据类型:布尔型(bool)
- 特征名:用户ID(user_id),数据类型:二进制类型(binary)
- 特征名:用户职业标签(user_occupation_label),数据类型:64位整型(int64)
- 特征名:用户职业文本(user_occupation_text),数据类型:字符串型(string)
- 特征名:用户评分(user_rating),数据类型:32位浮点型(float32)
- 特征名:用户邮政编码(user_zip_code),数据类型:字符串型(string)
数据拆分:
- 拆分名称:训练集(train),占用字节数:11081663,样本数量:100000
下载大小:1481407
数据集总大小:11081663
配置项:
- 配置名称:默认配置(default),数据文件:
- 对应拆分:训练集(train),文件路径:data/train-*
提供机构:
DukeNLPGroup



