Chinese Real-World Noise Dataset
收藏数据集概述
数据集名称:Chinese Real-World Noise Dataset
音频格式:WAV(16 kHz 采样率)
数据规模:共 3338 个音频文件,总时长 7.42 小时
场景类别:4 种真实中国环境噪声场景
许可证:CC BY-NC 4.0(仅限非商业用途)
场景分布
| 场景 | 文件数 | 时长 | 描述 |
|---|---|---|---|
| 医院 | 167 | 0.37 小时 | 医院室内环境噪声及公共区域声学背景 |
| 市场 | 1799 | 4.00 小时 | 包含人群活动和商贩/环境声的市场噪声(实验中作为未见场景) |
| 火车站 | 323 | 0.72 小时 | 火车站背景噪声,含车站环境声及广播类声学条件 |
| 餐厅 | 1049 | 2.33 小时 | 餐厅噪声,含餐厅环境声及多人对话背景声 |
数据文件结构
根目录 ├── hospital/ # 医院场景子目录 ├── market/ # 市场场景子目录 ├── rail_station/ # 火车站场景子目录 ├── restaurant/ # 餐厅场景子目录 ├── metadata.csv # 每个音频文件的元数据记录 ├── scene_summary.csv # 按场景统计的文件数和总时长 └── README.md, LICENSE, CITATION.cff 等
每个场景文件夹下包含若干录音会话子文件夹(如 hospital_1_16k、market_3_16k)。
元数据字段(metadata.csv)
file_path:音频文件相对路径scene:顶层声学场景标签subfolder:录音会话文件夹名duration_sec:音频时长(秒)sample_rate:采样率(Hz)channels:声道数bit_depth:WAV 位深度format:音频格式location_type:粗略地点类别collection_source:采集来源(self-collected)split_note:实验中场景用途说明license:数据许可证
推荐实验用途
- 训练/验证场景:医院、火车站、餐厅(作为可见场景)
- 测试未见场景:市场(用于评估模型泛化能力)
- 适用研究领域:语音增强、普通话语音增强、噪声鲁棒语音处理、中国真实噪声下的域自适应、未见场景鲁棒性评估
- 使用说明:用户可自行划分训练/验证/测试集,但需避免训练与评估中存在相同的噪声片段
隐私与伦理说明
录制目的为捕获环境噪声,非私人对话。用户不得尝试从音频中识别个人、地点或说话者。如发现隐私敏感内容,请联系维护者处理。
引用方式
若使用本数据集,请引用以下信息:
bibtex @misc{mei2026_chinese_real_world_noise, title={Chinese Real-World Noise Dataset}, author={Mei, Lingxiang}, year={2026}, howpublished={GitHub repository}, note={Self-collected Chinese real-world noise recordings for speech enhancement research} }
维护者
- 姓名:Lingxiang Mei
- 机构:北京邮电大学国际学院
- 邮箱:meilx@bupt.edu.cn




