AVASpeech-SMAD

Name: AVASpeech-SMAD
Creator: 佐治亚理工学院音乐技术中心
Published: 2021-11-02 09:40:32
License: 暂无描述

arXiv2021-11-02 更新2024-06-21 收录

下载链接：

https://github.com/biboamy/AVASpeech_Music_Labels

下载链接

链接失效反馈

官方服务：

资源简介：

AVASpeech-SMAD数据集由佐治亚理工学院音乐技术中心创建，旨在支持语音和音乐活动检测（SMAD）研究。该数据集是对原有AVASpeech数据集的扩展，增加了帧级别的音乐标签，使得数据集成为首个包含音乐和语音强多音标签的开源数据集。数据集包含160个15分钟的YouTube视频片段，总时长45小时，涵盖多种内容、语言、流派和制作质量。数据集的创建过程包括手动标注和验证，通过迭代交叉检查和简单的自动检查来确保标签质量。该数据集适用于训练和评估未来的SMAD系统，特别是在解决现实世界中语音和音乐共存问题方面具有重要意义。

提供机构：

佐治亚理工学院音乐技术中心

创建时间：

2021-11-02

5,000+

优质数据集

54 个

任务类型

进入经典数据集