DnR-nonverbal|音频源分离数据集|电影声音分析数据集
收藏DnR-nonverbal数据集概述
基本信息
- 标题: DnR-nonverbal dataset
- DOI: 10.5281/zenodo.15470640
- 版本: v1
- 发布日期: May 20, 2025
- 发布者: Zenodo
- 资源类型: Dataset
- 会议: Interspeech 2025
- 许可协议: Creative Commons Attribution 4.0 International
- 创建者:
- Takuya, Hasumi
- Yusuke, Fujita
数据集描述
DnR-nonverbal是一个基于Divide and Remaster (DnR)数据集的电影音频源分离(CASS)数据集。与常规数据集不同,该数据集包含如笑声和尖叫等非语言声音,类似于实际电影音频。该数据集使CASS模型能够将非语言声音分配到与语音相同的音轨中。
数据集结构
数据集结构基于DnR,但包含作为语音音轨一部分的非语言声音。
dnr-nonverbal ├── tr │ ├── 100009 │ │ ├── annots.csv │ │ ├── background.wav │ │ ├── foreground.wav │ │ ├── mix.wav │ │ ├── music.wav │ │ ├── nonverbal.wav │ │ ├── reading.wav │ │ ├── sfx.wav │ │ └── speech.wav │ ├── 100031 │ ... ├── cv └── tt
文件说明
- reading.wav: 从LibriSpeech提取的阅读风格语音。
- nonverbal.wav: 从FSD50K收集和新从FreeSound爬取的非语言声音。
- speech.wav: 阅读风格语音和非语言声音的混合。
- music.wav: 从FMA (medium)提取的背景音乐。
- foreground.wav: 从FSD50K收集的前景效果声音。
- background.wav: 从FSD50K收集的背景效果声音。
- sfx.wav: 前景和背景效果声音。
- annots.csv: 识别声音来源的元数据文件。
使用方法
- 从页面下载dnr-nonverbal.tar.gz。
- 使用
tar xvzf dnr-nonverval.tar.gz解压文件。 - (可选) 与DnR目录混合。样本ID的分配方式确保不与DnR重复。
文件信息
- 名称: dnr-nonverbal.tar.gz
- 大小: 22.7 GB
- MD5: c3d80ce875d8d408439a20b65d6c4405
统计信息
- 总浏览量: 31
- 总下载量: 7
- 总数据量: 340.4 GB
关键词
- audio source separation
- cinematic audio source separation
- non-verbal sound
引用格式
Takuya, H., & Yusuke, F. (2025). DnR-nonverbal dataset [Data set]. Interspeech 2025. Zenodo. https://doi.org/10.5281/zenodo.15470640

- 1DnR-nonverbal: Cinematic Audio Source Separation Dataset Containing Non-Verbal SoundsLY Corporation, Japan · 2025年
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
MineNetCD
MineNetCD数据集由慕尼黑工业大学等机构创建,是一个全球矿区变化检测的综合基准数据集。该数据集包含超过70k对的双时相高分辨率遥感图像,覆盖全球100个矿区,总面积约6756.88平方公里。数据集的创建过程结合了半自动标注和专家手动标注,确保了数据的精细度和准确性。MineNetCD数据集主要应用于矿区环境监测和可持续发展研究,旨在通过高精度的变化检测技术,帮助实现矿区的可持续管理和环境保护。
arXiv 收录
集装箱数据集
集装箱数据集,包含3500张1080p集装箱图像以及其编码区的xml标注
AI_Studio 收录
