Anime-Recommendation-System|动漫推荐数据集|用户评价数据集
收藏数据集概述
数据集名称
Anime-Recommendation-System
数据集描述
本数据集包含73,516名用户对12,294部动漫的偏好数据。用户可以将其完成的动漫添加到列表中并给出评分,本数据集即为这些评分的汇总。
数据集内容
Anime.csv
- anime_id: myanimelist.net的唯一动漫标识。
- name: 动漫的全名。
- genre: 动漫的类型,以逗号分隔。
- type: 动漫类型,如电影、TV、OVA等。
- episodes: 动漫的集数(如果是电影则为1)。
- rating: 动漫的平均评分,满分为10分。
- members: 参与该动漫社区的成员数。
Rating.csv
- user_id: 随机生成的非识别性用户ID。
- anime_id: 用户评分的动漫ID。
- rating: 用户给出的评分,满分为10分(如果用户观看但未评分,则为-1)。
推荐系统类型
本数据集用于内容基于过滤的推荐系统。该系统通过比较物品内容与用户配置文件来推荐物品。每个物品的内容被表示为一组描述符或术语,通常是文档中出现的单词。推荐系统根据用户提供的数据(明确或隐含)生成用户配置文件,并据此为用户提供建议。随着用户提供更多输入或对推荐采取行动,推荐引擎的准确性将不断提高。
数据集来源
数据集取自myanimelist.net API。

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
LEVIR-CD
LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。
OpenDataLab 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录