Million Song Dataset|音乐数据分析数据集|音乐推荐系统数据集
收藏数据集概述
数据集名称
Million Song Dataset in SQL Server 2017
数据集用途
用于在SQL Server 2017中构建歌曲推荐服务。
数据集组成部分
-
Unique songs - 包含唯一歌曲信息的数据文件。
- 下载链接:Unique songs
-
User taste profiles - 用户口味配置文件,包含用户对歌曲的评分数据。
- 下载链接:User taste profiles
- 需手动解压缩到同一文件夹。
-
Known mismatches of song IDs - 用于纠正已知数据质量问题的歌曲ID不匹配数据。
数据集引用
- 作者:Thierry Bertin-Mahieux, Daniel P.W. Ellis, Brian Whitman, and Paul Lamere
- 出版物:Proceedings of the 12th International Society for Music Information Retrieval Conference (ISMIR 2011)
- 年份:2011
数据集详细信息
- 获取数据集:Getting the Million Song dataset
- 口味配置文件数据子集:The Taste Profile data subset
- 已知错误及修复:Known errors in the Taste Profile dataset 和 Fixing these known errors in the Taste Profile dataset
- 数据集GitHub页面:GitHub page for the MSD
- 数据集挑战论文:MSD Challenge paper

China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录
全国 1∶200 000 数字地质图(公开版)空间数据库
As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.
DataCite Commons 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
HIT-UAV
HIT-UAV数据集是由中国科学院计算技术研究所分布式系统研究中心创建,专注于无人机(UAV)基于高海拔红外热成像的目标检测。该数据集包含2898张从数百个视频中提取的43470帧红外热图像,涵盖学校、停车场、道路和游乐场等多种场景。数据集不仅提供图像,还记录了飞行高度、相机视角、日期和日光强度等关键飞行数据。每张图像均手动标注了两种类型的边界框(定向和标准),以应对航空图像中目标实例显著重叠的挑战。HIT-UAV旨在解决夜间操作和隐私问题,是首个公开可用的高海拔UAV红外热数据集,用于检测人员和车辆,适用于多种UAV应用和研究,如夜间搜索和救援任务、飞行高度与目标检测精度的关系研究等。
arXiv 收录
HyperGlobal-450K - 全球最大规模高光谱图像数据集
HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。
github 收录