MovieLens-32M扩展数据集
收藏arXiv2025-04-03 更新2025-04-07 收录
下载链接:
https://uwaterlooir.github.io/datasets/ml-32mextension
下载链接
链接失效反馈官方服务:
资源简介:
MovieLens-32M扩展数据集是由滑铁卢大学的研究团队创建的,旨在为推荐系统提供新的评估目标。该数据集包含了51位MovieLens用户的评分档案和31236条关于未评分电影的相关性判断。这些判断是通过用户对推荐电影的海报、标题、年份、剧情摘要等信息的评估得出的,目的是预测用户可能会感兴趣观看的电影。该数据集的应用领域是推荐系统,特别是用于评估推荐算法的性能,减少或消除评估中的流行度偏差。
The MovieLens-32M extended dataset was created by a research team from the University of Waterloo, aiming to provide novel evaluation benchmarks for recommender systems. This dataset contains rating profiles of 51 MovieLens users and 31,236 relevance judgments for unrated movies. These judgments are derived from users' evaluations of information such as posters, titles, release years, and plot summaries of recommended movies, with the goal of predicting movies that users may be interested in watching. This dataset is applied in the field of recommender systems, specifically for evaluating the performance of recommendation algorithms and mitigating or eliminating popularity bias in evaluations.
提供机构:
滑铁卢大学
创建时间:
2025-04-03
搜集汇总
数据集介绍

构建方式
MovieLens-32M扩展数据集通过传统的信息检索测试集构建技术进行扩展,旨在为推荐系统提供新的评估目标。研究团队在获得伦理审查委员会的批准后,从movielens.org招募了51名参与者,收集了他们的评分档案,并使用多种推荐算法生成了推荐列表。参与者通过一个专门的网站评估了这些推荐,评估内容包括对电影的熟悉度、观看兴趣以及对未观看电影的预测评分。通过这种方式,数据集不仅扩展了原有的MovieLens-32M数据集,还引入了基于用户实际兴趣的评估标准。
特点
该数据集的主要特点在于其基于用户实际兴趣的评估标准,而非传统的评分预测。数据集包含了51名参与者的评分档案和31,236条对未评分电影的相关性判断,覆盖了多种评估目标,如观看兴趣、熟悉度和预测评分。此外,数据集通过多样性算法生成推荐池,确保了评估的全面性和多样性。这种设计有效地减少了传统评估方法中的流行度偏差,提供了更贴近实际用户需求的评估结果。
使用方法
使用该数据集时,研究人员可以通过兴趣.qrels文件获取用户对电影的观看兴趣偏好,并结合兼容性度量(compatibility measure)进行评估。推荐算法应利用所有评分进行训练,并为51名参与者生成推荐列表,同时过滤掉他们已经评分的电影。数据集还提供了多种其他相关性判断文件,如seen-interest.qrels和unseen-interest.qrels,用于研究算法在不同情境下的表现。建议优先使用兴趣.qrels文件进行排名评估,而评分相关的qrels文件则适用于评分预测任务。
背景与挑战
背景概述
MovieLens-32M扩展数据集由加拿大滑铁卢大学的Mark D. Smucker和Houmaan Chamani于2025年3月发布,旨在解决推荐系统离线评估中的核心问题。传统评估方法将推荐系统视为机器学习问题,通过将用户评分分为训练集和测试集来预测用户对电影的喜好,然而这种方法与用户实际寻找感兴趣电影的目标存在偏差。该数据集通过引入新的评估目标,如预测用户的“待观看列表”,并采用信息检索领域的测试集合构建技术,显著提升了推荐系统评估的准确性和实用性。该数据集的影响力在于其能够减少评估过程中的流行度偏差,为推荐系统研究提供了更可靠的基准。
当前挑战
MovieLens-32M扩展数据集面临的挑战主要包括两个方面。首先,在解决领域问题方面,传统评估方法存在流行度偏差和稀疏性问题,即评估结果偏向于流行电影,且评分数据稀疏导致评估不准确。其次,在数据构建过程中,研究人员需要克服用户参与和数据收集的复杂性,包括招募用户、生成多样化的推荐算法池、以及确保用户评估的一致性和可靠性。此外,数据集还需处理电影信息的完整性和一致性,例如通过TMDB API获取电影元数据并过滤无效或成人内容。这些挑战使得数据集的构建过程既复杂又耗时,但也为其在推荐系统研究中的高质量应用奠定了基础。
常用场景
经典使用场景
MovieLens-32M扩展数据集在推荐系统研究中扮演着重要角色,尤其在电影推荐领域。该数据集通过引入用户对未评分电影的兴趣评估,为研究者提供了一个更贴近真实场景的评估框架。传统推荐系统评估依赖于用户已有的评分数据,而该数据集则通过用户对推荐电影的兴趣反馈,使得评估更加贴近用户的实际需求。
实际应用
在实际应用中,MovieLens-32M扩展数据集为在线流媒体平台的电影推荐系统提供了重要的评估工具。通过模拟用户对推荐电影的兴趣反馈,平台可以更准确地评估推荐算法的效果,从而优化推荐策略,提升用户体验。此外,该数据集还可用于研究用户兴趣的多样性,帮助平台设计更加个性化的推荐系统。
衍生相关工作
该数据集的推出催生了一系列相关研究,特别是在推荐系统评估方法上的创新。例如,研究者们开始探索基于用户兴趣反馈的评估指标,如兼容性度量(compatibility measure),以替代传统的基于评分的评估方法。此外,该数据集还被用于研究推荐系统中的冷启动问题和用户兴趣建模,推动了推荐系统领域的理论和方法进步。
以上内容由遇见数据集搜集并总结生成



