MovieLens 32M and MovieLens 1B Synthetic Dataset
收藏MovieLens 推荐系统
该项目展示了一个为媒体流媒体平台(灵感来自Netflix)开发的复杂推荐系统,使用MovieLens 1B合成数据集。系统采用混合方法,结合协同过滤、基于内容的过滤和基于图的推荐,提供个性化的电影建议。
项目结构
├── LICENSE <- 开源许可证(如果已选择)
│
├── Makefile <- 包含便捷命令的Makefile,如make data或make train
│
├── README.md <- 用于开发人员使用此项目的顶级README文件。
│
├── data
│ │
│ ├── external <- 来自第三方源的数据。
│ │
│ ├── interim <- 已转换的中间数据。
│ │
│ ├── processed <- 用于建模的最终规范数据集。
│ │
│ └── raw <- 原始的不可变数据转储。
│
├── environment.yml <- 用于重现分析环境的要求文件,例如使用pip freeze > requirements.txt生成
│
├── models <- 训练好的序列化模型、模型预测或模型摘要
│
├── notebooks <- Jupyter笔记本。命名约定为数字(用于排序)、创建者首字母和简短的-分隔描述,例如1.0-jqp-initial-data-exploration
│
└── src <- 用于此项目的源代码
│
├── init.py <- 使src成为一个Python模块
│
├── dataset.py <- 用于下载或生成数据的脚本
│
├── features.py <- 用于创建建模特征的代码
│
├── modeling
│ │
│ ├── init.py
│ │
│ ├── predict.py <- 使用训练好的模型运行模型推理的代码
│ │
│ └── train.py <- 用于训练模型的代码
│
└── plots.py <- 用于创建可视化的代码




