five

BUT ReverbDB

收藏
arXiv2019-05-30 更新2024-06-21 收录
下载链接:
https://speech.fit.vutbr.cz/software/but-speech-fit-reverb-database
下载链接
链接失效反馈
官方服务:
资源简介:
BUT ReverbDB是由布尔诺理工大学创建的一个包含真实房间脉冲响应(RIR)、背景噪声和重传输语音数据的数据集。该数据集目前包含来自8个房间的数据,并不断增长。数据集旨在为语音社区提供用于数据增强和远场麦克风或麦克风阵列实验的数据,以解决自动语音识别(ASR)和说话人识别(SRE)中的问题。

BUT ReverbDB is a dataset created by Brno University of Technology, which contains real room impulse responses (RIRs), background noise, and reverberant speech data. Currently, it includes data from 8 rooms and is continuously expanding. The dataset is designed to provide the speech research community with data for data augmentation and far-field microphone or microphone array experiments, to address challenges in automatic speech recognition (ASR) and speaker recognition (SRE).
提供机构:
布尔诺理工大学
创建时间:
2018-11-16
搜集汇总
数据集介绍
main_image_url
构建方式
在远场语音识别的研究中,真实房间脉冲响应的获取对于数据增强至关重要。BUT ReverbDB的构建采用了系统化的采集流程,在八个不同尺寸的房间中部署了31个麦克风,并设置了多个扬声器位置。通过指数正弦扫频技术测量房间脉冲响应,同时录制环境噪声,并重传了LibriSpeech等公开语音数据集,确保了数据的多样性和实用性。采集过程中还详细记录了麦克风与扬声器的坐标信息,为后续分析提供了丰富的元数据支持。
特点
该数据集涵盖了多样化的声学环境,包括办公室、楼梯间和会议室等八种房间类型,其混响时间范围从0.59秒到1.85秒,麦克风与扬声器距离最远可达15米。数据集不仅包含真实的房间脉冲响应和环境噪声,还提供了重传的语音数据,特别注重非标准麦克风位置的覆盖,如隐藏或部分遮挡的麦克风,以模拟实际应用中的复杂场景。这种设计使得数据集在远场语音识别和声学处理研究中具有高度的代表性和挑战性。
使用方法
BUT ReverbDB主要用于语音识别系统的数据增强,特别是在缺乏目标领域训练数据的情况下。研究人员可以通过卷积操作将干净的语音数据与数据集中的房间脉冲响应结合,模拟远场录音环境,并添加相应的环境噪声以提升模型的鲁棒性。数据集中提供的Kaldi配方支持对AMI等公开数据集进行增强处理,并可在单远场麦克风设置下评估系统性能。此外,详细的元数据允许用户根据麦克风位置、方向等条件筛选数据,以针对特定声学场景进行定制化实验。
背景与挑战
背景概述
BUT ReverbDB 是由布尔诺科技大学 Speech@FIT 研究团队于 2019 年构建的公开数据集,专注于远场语音处理领域。该数据集的核心研究问题在于解决自动语音识别系统在真实混响环境中的性能退化问题,通过提供高质量的真实房间脉冲响应、环境噪声及重传语音数据,为数据增强技术提供关键资源。其创建动机源于现有公开 RIR 数据在覆盖场景多样性、非标准麦克风布局及精确元数据方面的不足,旨在支持语音增强、去混响及波束成形等研究方向,对提升远场语音识别与说话人验证系统的鲁棒性具有重要学术价值。
当前挑战
该数据集致力于应对远场自动语音识别中因训练与测试环境失配导致的性能下降挑战,特别是在复杂声学场景下,如麦克风被部分或完全遮挡、声源与麦克风非对准等非合作布局。构建过程中的主要挑战包括:在多样化的真实房间中精确测量脉冲响应需克服时钟异步、非线性失真及环境噪声干扰;采集覆盖不同尺寸、材质与布局的声学环境以保障数据多样性;设计并部署多类型麦克风阵列与隐蔽式麦克风装置以模拟实际监控与智能家居场景;同时需确保元数据的完整性与精确性,以支持后续深入的声学分析与模型训练。
常用场景
经典使用场景
在远场自动语音识别研究中,BUT ReverbDB 数据集常被用于训练数据的增强与系统验证。通过将纯净语音与真实房间脉冲响应卷积,并叠加环境噪声,研究者能够模拟多样化的声学场景,从而提升模型在复杂环境下的鲁棒性。该数据集尤其适用于评估不同数据增强策略对词错误率的影响,为远场语音识别系统的开发提供了关键实验平台。
实际应用
在实际应用中,BUT ReverbDB 被广泛用于智能家居、会议系统及安防监控等领域的远场语音识别系统开发。例如,在智能助理设备中,利用该数据集增强训练数据,可以显著提升设备在家庭不同房间环境下的语音理解准确率。此外,其包含的隐蔽麦克风位置数据,为安防领域的监听设备声学特性分析提供了宝贵资源,助力复杂场景下的语音信号处理。
衍生相关工作
基于 BUT ReverbDB,研究者开展了一系列经典工作,包括在 AMI 会议语料库上进行的训练数据增强实验,验证了真实与人工脉冲响应的互补性。该数据集还支撑了关于脉冲响应被动化与延迟补偿的技术研究,并促进了如 CHiME、REVERB 等挑战赛中系统鲁棒性的深入分析。这些衍生工作进一步推动了远场语音识别与声学环境建模领域的方法创新与性能提升。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作