Million Song Dataset|音乐数据分析数据集|音乐推荐系统数据集
收藏数据集概述
数据集名称
Million Song Dataset in SQL Server 2017
数据集用途
用于在SQL Server 2017中构建歌曲推荐服务。
数据集组成部分
- 
Unique songs - 包含唯一歌曲信息的数据文件。 - 下载链接:Unique songs
 
- 
User taste profiles - 用户口味配置文件,包含用户对歌曲的评分数据。 - 下载链接:User taste profiles
- 需手动解压缩到同一文件夹。
 
- 
Known mismatches of song IDs - 用于纠正已知数据质量问题的歌曲ID不匹配数据。 
数据集引用
- 作者:Thierry Bertin-Mahieux, Daniel P.W. Ellis, Brian Whitman, and Paul Lamere
- 出版物:Proceedings of the 12th International Society for Music Information Retrieval Conference (ISMIR 2011)
- 年份:2011
数据集详细信息
- 获取数据集:Getting the Million Song dataset
- 口味配置文件数据子集:The Taste Profile data subset
- 已知错误及修复:Known errors in the Taste Profile dataset 和 Fixing these known errors in the Taste Profile dataset
- 数据集GitHub页面:GitHub page for the MSD
- 数据集挑战论文:MSD Challenge paper

stanford_cars
该数据集是一个包含多个汽车品牌和型号的图片数据集,每个图片样本都标记有相应的汽车品牌和型号信息。数据集适用于图像识别和分类任务,特别是汽车品牌和型号的识别。
huggingface 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
猫狗分类
## 数据集描述 ### 数据集简介 本数据集是简单的猫狗二分类数据集,共2个类别,其中训练集包含275张带注释的图像,验证集包含70张带注释的图像。整个数据集共10.3MB,可用于快速模型验证、性能评估、小数据集训练等。 ### 数据集支持的任务 可用于快速模型验证、性能评估、小数据集训练等。 ## 数据集的格式和结构 ### 数据格式 数据集包括训练集train和验证集val,train和val文件夹之下按文件夹进行分类,共有2个子文件夹,同类别标签的图片在同一个文件夹下,图片格式为JPG。同时包含与标注文件中label id相对应的类名文件classname.txt。 ### 数据集加载方式 ```python from modelscope.msdatasets import MsDataset from modelscope.utils.constant import DownloadMode ms_train_dataset = MsDataset.load( 'cats_and_dogs', namespace='tany0699', subset_name='default', split='train') # 加载训练集 print(next(iter(ms_train_dataset))) ms_val_dataset = MsDataset.load( 'cats_and_dogs', namespace='tany0699', subset_name='default', split='validation') # 加载验证集 print(next(iter(ms_val_dataset))) ``` ### 数据分片 本数据集包含train和val数据集。 | 子数据集 | train | val | test | |---------|-------------:|-----------:|---------:| | default | 训练集 | 验证集 | / | ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/tany0699/cats_and_dogs.git ```
魔搭社区 收录
Global Urban Boundaries (GUB)
Global Urban Boundaries (GUB) 数据集包含了全球城市边界的详细信息,提供了高分辨率的城市边界数据,用于分析城市化进程和城市扩张。
datacatalog.worldbank.org 收录
