Dog-Vocal-Separation
收藏Hugging Face2025-04-26 更新2025-04-27 收录
下载链接:
https://huggingface.co/datasets/ArlingtonCL2/Dog-Vocal-Separation
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于狗狗叫声分离的数据集,包含了训练集、验证集和测试集。每个集合中包含混合音频和对应的真实狗狗叫声音频对。训练集提供了混合音频和狗狗叫声,而测试集仅包含混合音频。数据集的构建使用了来自之前工作的狗狗叫声,经过填充处理,并与AudioSet中的背景噪音混合。所有音频的采样率为32,000 kHz。
This is a dataset for dog vocalization separation, which includes training, validation, and test subsets. Each subset contains pairs of mixed audio and the corresponding ground-truth dog vocalization audio. The training subset provides both mixed audio and dog vocalizations, while the test subset only includes mixed audio. The dataset is constructed using dog vocalizations sourced from prior research, which have been processed with padding, and mixed with background noises from AudioSet. All audio has a sampling rate of 32,000 kHz.
创建时间:
2025-04-14
搜集汇总
数据集介绍

构建方式
在犬类声学研究的背景下,Dog-Vocal-Separation数据集通过系统化方法构建而成。原始犬吠数据源自Wang等人(2024)采集的1-2秒短音频样本,经技术处理统一扩展为10秒长度。背景噪声则精选自AudioSet音频事件库,采用排列组合策略将犬吠与不同噪声混合,同时严格确保各数据子集间不存在样本重叠。最终形成包含125,476个训练样本对的声学数据集,总时长达到348小时。
特点
该数据集最显著的特征在于其专业的声音分离任务设计。所有音频样本均以32kHz高采样率录制,包含纯净犬吠与混合音频的精确配对。数据划分科学严谨,训练集、验证集和测试集分别包含125,476、16,830和3,000个样本,且通过文件名映射确保样本溯源。特别值得注意的是,测试集仅提供混合音频,符合真实场景下的声音分离挑战需求。
使用方法
研究者可通过HuggingFace平台获取该数据集,利用配套的post_download.py脚本还原原始目录结构。使用时应特别注意:模型输出需严格匹配测试集文件名规范,保持32kHz采样率,并通过提供的si_sdr.py脚本进行客观评估。对于IJCAI-2025挑战赛参与者,需遵循test_pairs.csv中的文件命名要求提交10秒长度的犬吠分离结果。
背景与挑战
背景概述
Dog-Vocal-Separation数据集由国际人工智能联合会议(IJCAI-2025)挑战赛组委会于2025年发布,旨在推动生物声学与音频信号处理领域的交叉研究。该数据集基于Wang等人(2024)关于犬类发声的语音学研究成果,通过整合AudioSet环境音库构建而成,专注于解决复杂声学场景下的犬吠声分离问题。作为首个面向动物声纹分离的大规模数据集,其348小时的标注数据为声源分离算法提供了重要基准,对动物行为分析、智能宠物监护等应用具有显著推动作用。
当前挑战
该数据集面临双重技术挑战:在学术层面,犬吠声的短时非平稳特性(平均1-2秒)与32kHz高采样率要求,对时频域分离算法的分辨率提出苛刻要求;在构建层面,需确保12万组混合样本中犬吠与背景噪声的严格独立分布,避免数据泄漏。测试集仅提供混合音频的设计,迫使模型必须解决盲源分离问题,而SI-SDR评估指标则要求算法在保持信号保真度的同时实现精准的声纹提取。
常用场景
经典使用场景
在动物行为学和计算听觉场景分析领域,Dog-Vocal-Separation数据集为研究者提供了独特的实验平台。该数据集通过精心设计的混合狗吠声与背景噪声的音频对,成为声源分离算法验证的黄金标准。其10秒长度的标准化样本和严格划分的训练验证测试集,特别适合用于深度神经网络在复杂声学环境下的性能评估,为声学信号处理研究树立了新的基准。
实际应用
在智能宠物监护和城市噪声监测系统中,该数据集展现出重要的应用价值。基于其训练的模型可准确识别混杂在环境声中的犬吠,为远程宠物健康监测提供技术支撑。市政部门利用衍生算法能够量化分析社区犬吠噪声污染,实现精准的声环境管理。这些应用充分体现了从实验室研究到社会服务的转化潜力。
以上内容由遇见数据集搜集并总结生成



