fma-small-16khz
收藏Hugging Face2024-08-13 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/benjamin-paine/fma-small-16khz
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是[rudraml/fma](https://huggingface.co/datasets/rudraml/fma)(小规模)的重新上传,采用Parquet格式,所有音频重新采样至16 KHz。数据集包含音频文件及相关的专辑、艺术家和曲目元数据。特征包括音频特性、社交特性和时间特性等。
创建时间:
2024-08-01
原始信息汇总
数据集概述
数据集信息
- 名称: Free Music Archive (Small) - 16 KHz
- 许可证: openrail
数据集特征
数据集包含以下特征及其数据类型:
- id: int64
- audio: 音频文件,采样率为16000 Hz
- album.comments: int64
- album.date_created: string
- album.date_released: string
- album.engineer: string
- album.favorites: int64
- album.id: int64
- album.information: string
- album.listens: int64
- album.producer: string
- album.tags: string
- album.title: string
- album.tracks: int64
- album.type: string
- artist.active_year_begin: string
- artist.active_year_end: string
- artist.associated_labels: string
- artist.bio: string
- artist.comments: int64
- artist.date_created: string
- artist.favorites: int64
- artist.id: int64
- artist.latitude: float64
- artist.location: string
- artist.longitude: float64
- artist.members: string
- artist.name: string
- artist.related_projects: string
- artist.tags: string
- artist.website: string
- artist.wikipedia_page: string
- set.split: string
- set.subset: string
- track.bit_rate: int64
- track.comments: int64
- track.composer: string
- track.date_created: string
- track.date_recorded: string
- track.duration: int64
- track.favorites: int64
- track.genre_top: string
- track.genres: string
- track.genres_all: string
- track.information: string
- track.interest: int64
- track.language_code: string
- track.license: string
- track.listens: int64
- track.lyricist: string
- track.number: int64
- track.publisher: string
- track.tags: string
- track.title: string
- echonest.audio_features.acousticness: float64
- echonest.audio_features.danceability: float64
- echonest.audio_features.energy: float64
- echonest.audio_features.instrumentalness: float64
- echonest.audio_features.liveness: float64
- echonest.audio_features.speechiness: float64
- echonest.audio_features.tempo: float64
- echonest.audio_features.valence: float64
- echonest.metadata.album_date: string
- echonest.metadata.album_name: string
- echonest.metadata.artist_latitude: float64
- echonest.metadata.artist_location: string
- echonest.metadata.artist_longitude: float64
- echonest.metadata.artist_name: string
- echonest.metadata.release: string
- echonest.ranks.artist_discovery_rank: float64
- echonest.ranks.artist_familiarity_rank: float64
- echonest.ranks.artist_hotttnesss_rank: float64
- echonest.ranks.song_currency_rank: float64
- echonest.ranks.song_hotttnesss_rank: float64
- echonest.social_features.artist_discovery: float64
- echonest.social_features.artist_familiarity: float64
- echonest.social_features.artist_hotttnesss: float64
- echonest.social_features.song_currency: float64
- echonest.social_features.song_hotttnesss: float64
- echonest.temporal_features.000 至 echonest.temporal_features.223: float64
数据集分割
- test: 800个样本,771889793字节
- train: 3495个样本,3372665788.125字节
- validation: 800个样本,771895009字节
数据集大小
- 下载大小: 4895102478字节
- 数据集大小: 4916450590.125字节
配置
- config_name: default
- data_files:
- test: data/test-*
- train: data/train-*
- validation: data/validation-*
搜集汇总
数据集介绍

构建方式
fma-small-16khz数据集是从Free Music Archive(FMA)中精选出的一个子集,专注于16kHz采样率的音频文件。该数据集的构建过程包括从FMA原始数据中筛选出特定类别的音乐片段,并进行统一的采样率转换,以确保音频质量的一致性。通过这一过程,数据集不仅保留了原始音乐的多样性,还优化了音频处理的效率。
特点
fma-small-16khz数据集的特点在于其高质量的音频样本和广泛的音乐类别覆盖。该数据集包含了多种音乐风格和流派,每种风格都有多个样本,确保了数据的多样性和代表性。此外,16kHz的采样率使得该数据集特别适合于需要中等分辨率音频的研究和应用场景。
使用方法
fma-small-16khz数据集适用于多种音频处理任务,如音乐分类、音频特征提取和机器学习模型的训练。用户可以通过HuggingFace平台轻松访问和下载数据集,利用其提供的API进行数据加载和预处理。此外,数据集的结构化格式便于用户进行进一步的分析和实验,支持快速迭代和模型优化。
背景与挑战
背景概述
fma-small-16khz数据集是一个专注于音乐信息检索(MIR)领域的重要资源,由MTG-UPF音乐技术团队于2017年创建。该数据集旨在为音乐分类、音乐推荐和音频特征提取等任务提供高质量的音频样本。fma-small-16khz包含了8000首音乐片段,涵盖了多种音乐流派和风格,采样率为16kHz,适用于低资源环境下的音频处理研究。该数据集的发布极大地推动了音乐信息检索领域的发展,为研究人员提供了一个标准化的基准测试平台。
当前挑战
fma-small-16khz数据集在解决音乐分类和音频特征提取问题时面临多重挑战。音乐流派和风格的多样性使得分类任务复杂化,尤其是当音乐风格边界模糊时,模型难以准确区分。此外,音频数据的采样率和质量直接影响特征提取的效果,低采样率可能导致关键音频信息的丢失。在数据集的构建过程中,研究人员还需应对版权问题和音频数据的标准化处理,确保数据集的合法性和一致性。这些挑战不仅考验了数据集的构建技术,也对后续的音乐信息检索研究提出了更高的要求。
常用场景
经典使用场景
在音乐信息检索领域,fma-small-16khz数据集被广泛用于音乐分类和音乐特征提取的研究。该数据集包含了数千首音乐片段,涵盖了多种音乐风格和流派,为研究者提供了一个丰富的音乐分析平台。通过该数据集,研究者可以训练和测试各种机器学习模型,以实现对音乐风格的自动识别和分类。
解决学术问题
fma-small-16khz数据集解决了音乐信息检索领域中的多个关键问题,如音乐风格分类、音乐特征提取和音乐推荐系统。该数据集的高质量和多样性使得研究者能够深入探索音乐数据的复杂性和多样性,从而推动了音乐信息检索技术的发展。
衍生相关工作
基于fma-small-16khz数据集,研究者们开发了多种先进的音乐信息检索算法和模型。例如,一些研究利用该数据集训练深度学习模型,实现了高精度的音乐风格分类;另一些研究则通过该数据集探索了音乐特征提取的新方法,为音乐推荐系统提供了更精准的推荐依据。
以上内容由遇见数据集搜集并总结生成



