five

PoliMovie Dataset for Recommender Systems

收藏
github2020-04-30 更新2024-05-31 收录
下载链接:
https://github.com/monanasery/PoliMovie-Dataset-for-Recommender-Systems
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集通过在线调查应用程序收集,目前仍在进行中。它包含334名用户对近1700部电影的评分,以及电影的一些特征,如类型、演员、导演、电影年份、电影制作国家。数据仅由可靠用户过滤。

This dataset is collected through an online survey application and is currently ongoing. It includes ratings from 334 users for nearly 1,700 movies, along with some features of the movies such as genre, actors, directors, year of release, and country of production. The data has been filtered to include only reliable users.
创建时间:
2015-11-18
原始信息汇总

数据集概述

名称: PoliMovie Dataset for Recommender Systems

收集方式: 通过在线调查应用程序收集。

当前状态: 数据集仍在进行中。

数据内容:

  • 用户数量: 334
  • 电影数量: 约1700
  • 电影特征: 包括电影的类型、演员、导演、年份、制作国家。
  • 数据筛选: 仅包含可靠用户的评价,通过强数据一致性检查筛选。

数据集统计

  • 电影: 1077部
  • 演员: 约300位
  • 导演: 200位
  • 类型: 所有类型至少被一位用户选为喜爱。

数据文件

  • userMovieRatings.csv: 包含332位用户喜欢的1610部电影,格式为userId,answer,movieName,ImdbId,ImdbRate,year,numVotes
  • userCastRatings.csv: 包含335位用户喜欢的421位演员,格式为workerId,starImdbID
  • userDirectorRatings.csv: 包含321位用户喜欢的299位导演,格式为worker_Id, directorImdbID

数据使用许可

  • 数据可用于研究目的,但不得未经允许重新分发或用于商业目的。
  • 如需在论文中使用此数据集,请引用相关论文。
搜集汇总
数据集介绍
main_image_url
构建方式
PoliMovie Dataset for Recommender Systems是通过在线调查应用收集而成,目前仍在进行中。该数据集的构建采取了严格的用户数据筛选机制,仅包含经过强数据一致性检查的可靠用户对电影的评分数据,确保了数据质量。数据涵盖了334名用户对近1700部电影的评分,以及电影的类型、演员、导演、年份和制片国家等信息。
使用方法
在使用PoliMovie Dataset for Recommender Systems时,用户需遵守特定的使用许可。数据集可用于任何研究目的,但未经单独许可,用户不得重新分发数据,亦不得用于任何商业或盈利性活动。若使用该数据集发表研究论文,需引用相关论文。数据集文件内容详细,包括用户ID、评分、电影名称、IMDB ID等,结构清晰,便于研究者进行推荐系统的研究与开发。
背景与挑战
背景概述
PoliMovie数据集是推荐系统领域的一个重要资源,由Mona Nasery在2015年通过在线调查应用收集而成,旨在为特征基础的推荐系统提供支持。该数据集汇聚了334名用户对近1700部电影的评分,以及电影类型、演员、导演、上映年份和制作国家等特征信息。其数据经过严格筛选,仅保留来自可靠用户的反馈。PoliMovie数据集的构建,不仅丰富了推荐系统研究的实验材料,也为该领域的研究提供了新的视角和方法,具有重要的影响力。
当前挑战
PoliMovie数据集在构建过程中面临了多个挑战:首先,如何确保用户数据的可靠性和一致性是一大挑战;其次,数据集的规模和多样性对数据收集和清洗提出了更高的要求。在所解决的领域问题方面,PoliMovie数据集需要应对的挑战包括如何利用用户对电影、演员、导演和类型的偏好来提高推荐系统的准确性和个性化水平。此外,数据集的持续更新和维护,以及如何在遵守使用许可的前提下促进学术交流,也是当前和未来需要考虑的问题。
常用场景
经典使用场景
在推荐系统研究领域,PoliMovie数据集以其独特的特征基础数据结构,成为了一个经典的使用案例。该数据集通过用户对电影的喜好选择,结合电影的特征信息,如类型、演员、导演、年份以及制片国家,为构建和评估电影推荐模型提供了丰富的资源。
解决学术问题
PoliMovie数据集解决了推荐系统中数据稀疏性和冷启动问题。通过用户对电影、演员、导演和类型的明确喜好,研究者能够设计出更精准的个性化推荐算法,同时也为评估不同推荐策略的有效性提供了基准。
实际应用
在实际应用中,PoliMovie数据集被广泛应用于电影推荐服务,如视频流媒体平台和在线售票系统,帮助用户发现和选择他们可能感兴趣的电影,从而提升用户体验并增加平台用户粘性。
数据集最近研究
最新研究方向
在推荐系统领域,PoliMovie数据集因其独特的特征基础架构而备受关注。近期研究主要聚焦于利用该数据集进行电影推荐算法的优化,尤其是深入探索用户对电影特征如类型、演员、导演等的偏好,以提升推荐系统的个性化和准确性。此外,研究者们也在探索如何通过该数据集进行用户行为模式的分析,从而在推荐系统中引入社交网络分析的概念,增强推荐系统的智能化水平。PoliMovie数据集的持续更新和其提供的详细电影特征,为相关研究提供了宝贵资源,对推动推荐系统领域的理论与实践发展具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作