AiresPucrs/movielens-user-ratings
收藏数据集概述
数据集名称
movielens-user-ratings
数据集来源
该数据集包含来自MovieLens网站的电影评分数据,MovieLens是一个电影推荐服务。数据由明尼苏达大学的GroupLens研究项目收集并提供。
数据集详情
- 语言: 英语
- 总大小: 100,836条记录
- 数据文件: 包含多个CSV文件,本数据集仅使用"ratings.csv"文件。
数据集结构
特征
- userId: 用户唯一标识符,数据类型为int64。
- movieId: 电影唯一标识符,数据类型为int64。
- rating: 评分,五星级评分制,数据类型为float64。
- timestamp: 评分时间戳,数据类型为int64。
数据分割
- train: 训练集,包含3226752字节,100836条记录。
数据集大小
- 下载大小: 1166644字节
- 数据集大小: 3226752字节
许可证
该数据集的许可证为"other"。
引用
latex @article{10.1145/2827872, author = {Harper, F. Maxwell and Konstan, Joseph A.}, title = {The MovieLens Datasets: History and Context}, year = {2015}, issue_date = {January 2016}, publisher = {Association for Computing Machinery}, address = {New York, NY, USA}, volume = {5}, number = {4}, issn = {2160-6455}, url = {https://doi.org/10.1145/2827872}, doi = {10.1145/2827872}, journal = {ACM Trans. Interact. Intell. Syst.}, month = dec, articleno = {19}, numpages = {19}, keywords = {Datasets, recommendations, ratings, MovieLens} }
使用方法
python from datasets import load_dataset
dataset = load_dataset("AiresPucrs/movielens-user-ratings", split=train)




