Anime-Recommendation-System

github2022-09-19 更新2024-05-31 收录

下载链接：

https://github.com/rai-shivangi/Anime_-recommendation_-system

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含73,516名用户对12,294个动漫的评价数据。用户可以将其观看过的动漫添加到完成列表中并给出评分，数据集是这些评分的汇总。

This dataset comprises evaluation data from 73,516 users on 12,294 anime titles. Users can add anime they have watched to their completed list and provide ratings, and this dataset aggregates these ratings.

创建时间：

2022-09-19

原始信息汇总

数据集概述

数据集名称

Anime-Recommendation-System

数据集描述

本数据集包含73,516名用户对12,294部动漫的偏好数据。用户可以将其完成的动漫添加到列表中并给出评分，本数据集即为这些评分的汇总。

数据集内容

Anime.csv

anime_id: myanimelist.net的唯一动漫标识。
name: 动漫的全名。
genre: 动漫的类型，以逗号分隔。
type: 动漫类型，如电影、TV、OVA等。
episodes: 动漫的集数（如果是电影则为1）。
rating: 动漫的平均评分，满分为10分。
members: 参与该动漫社区的成员数。

Rating.csv

user_id: 随机生成的非识别性用户ID。
anime_id: 用户评分的动漫ID。
rating: 用户给出的评分，满分为10分（如果用户观看但未评分，则为-1）。

数据集来源

数据集取自myanimelist.net API。

搜集汇总

数据集介绍

构建方式

该数据集通过整合myanimelist.net平台上的用户偏好数据构建而成，涵盖了73,516名用户对12,294部动漫的评分。每个用户能够将其观看过的动漫添加到已完成列表中，并给予评分，这些评分数据被系统性地收集和编译，形成了这一数据集。数据集包括两个主要文件：Anime.csv和Rating.csv，分别记录了动漫的基本信息和用户的评分信息。

特点

该数据集的显著特点在于其丰富的用户行为数据和详细的动漫属性信息。Anime.csv文件中包含了动漫的唯一标识符、名称、类型、集数、平均评分以及社区成员数量等详细信息。Rating.csv文件则记录了用户的匿名ID、所评分的动漫ID以及用户给出的评分，评分范围为0到10，若用户未给出评分则标记为-1。这些数据为基于内容的推荐系统提供了坚实的基础。

使用方法

该数据集适用于构建基于内容的推荐系统，通过分析用户对动漫的评分和偏好，生成个性化的推荐列表。具体方法包括使用TF-IDF（词频-逆文档频率）技术对动漫的类型进行加权，以识别用户可能感兴趣的动漫类型。此外，可以利用scikit-learn库中的成对度量方法，结合sigmoid核函数，对动漫进行推荐与否的二元分类。通过这些技术，系统能够根据用户的历史行为和偏好，提供精准的动漫推荐。

背景与挑战

背景概述

动漫推荐系统数据集（Anime-Recommendation-System）是由myanimelist.net平台提供的用户偏好数据集，涵盖了73,516名用户对12,294部动漫的评分信息。该数据集的核心研究问题在于如何基于用户的历史评分和动漫的属性特征，构建高效的推荐算法，以提升用户体验和个性化推荐效果。通过收集用户对动漫的评分和观看记录，研究人员能够分析用户偏好，进而开发基于内容的推荐系统。该数据集的创建不仅为推荐系统领域的研究提供了丰富的数据资源，还为动漫产业的用户行为分析和市场策略制定提供了重要参考。

当前挑战

动漫推荐系统数据集在构建和应用过程中面临多项挑战。首先，数据集的规模较大，涉及数十万用户和上万部动漫，如何在海量数据中高效提取用户偏好信息是一个技术难题。其次，用户评分数据存在稀疏性问题，部分用户可能仅对少数动漫进行评分，导致推荐算法的准确性受到影响。此外，动漫的多样性和复杂性，尤其是多重标签的分类问题，增加了基于内容推荐算法的复杂度。最后，如何在推荐系统中平衡用户个性化需求与整体社区偏好，确保推荐的多样性和准确性，也是该数据集面临的重要挑战。

常用场景

经典使用场景

在动漫推荐系统领域，Anime-Recommendation-System数据集的经典使用场景主要体现在基于内容的推荐算法中。该数据集通过分析用户对动漫的评分和偏好，构建用户画像，进而推荐与其兴趣相符的动漫作品。具体而言，系统利用动漫的类型、评分和社区成员数量等特征，结合TF-IDF算法，计算出每部动漫的特征权重，从而为用户提供个性化的动漫推荐。

衍生相关工作

基于Anime-Recommendation-System数据集，研究者们开发了多种推荐算法和模型，推动了推荐系统领域的进一步发展。例如，有研究者利用该数据集进行协同过滤算法的优化，通过分析用户间的相似性，提升推荐的准确性。此外，还有学者结合深度学习技术，构建了更为复杂的神经网络模型，以捕捉用户偏好的深层特征，从而实现更精准的动漫推荐。这些衍生工作不仅丰富了推荐系统的理论研究，也为实际应用提供了强有力的技术支持。

数据集最近研究

Anime-Recommendation-System

数据集概述

数据集名称

数据集描述

数据集内容

Anime.csv

Rating.csv

推荐系统类型

数据集来源