steamgamerecommender/data_files_public|游戏推荐数据集|社交网络分析数据集
收藏数据集概述
名称: Steam Game Ownership and User Friendships Dataset
目的: 用于构建个性化Steam游戏推荐系统。
规模: 包含80,000用户,34,000游戏,24,000,000游戏所有权记录,10,000,000用户友谊关系。
数据来源: 通过Steam的Web API抓取,采用雪球抽样(BFS)技术。
数据集结构
- 用户信息: 存储在
users.csv
中,记录参与雪球抽样的用户ID及其顺序。 - 友谊关系: 存储在
friends.csv
中,记录用户间的友谊关系。 - 游戏所有权: 存储在
users_games.csv
中,记录用户与游戏的对应关系及游戏时间。 - 游戏信息: 存储在
games.csv
中,记录新遇到的游戏及其相关信息如价格、标签、描述等。
注意事项
- 若用户或游戏在不同雪球中重复出现,其ID仍会被记录,但相关数据不会重复添加。
许可证

中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
MinneApple 苹果检测数据集
MinneApple 是一个用于苹果检测和分割的基准数据集。该数据集使用多边形掩码为每个对象实例进行标注,以帮助进行精确的对象检测、定位、和分割。此外,该数据集提供了基于补丁的聚类水果计数数据。该数据集在 1000 张图像中包含超过 41,0000 个带标注的对象实例。
超神经 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录