Multi-loudspeaker Binaural Room Impulse Response Dataset
收藏arXiv2024-03-19 更新2024-06-21 收录
下载链接:
https://doi.org/10.34770/6gc9-5787
下载链接
链接失效反馈官方服务:
资源简介:
本数据集名为‘多扬声器双耳房间脉冲响应数据集’,由普林斯顿大学的3D音频与应用声学实验室创建。数据集包含68,376条双耳房间脉冲响应(BRIR)数据,这些数据是在一个经过声学处理的听音室中,使用多个扬声器和高分辨率的翻译及旋转头坐标测量的。数据集的创建过程涉及复杂的测量和信号处理技术,确保了数据的高精度和可靠性。该数据集适用于双耳音频模型研究、机器学习任务以及需要多扬声器BRIR的应用,如交叉对话取消和个人声区渲染。
This dataset, officially named the *Multi-Speaker Binaural Room Impulse Response Dataset*, was created by the 3D Audio and Applied Acoustics Laboratory of Princeton University. It contains 68,376 binaural room impulse response (BRIR) samples, which were measured in an acoustically treated listening room using multiple loudspeakers and high-resolution measurements of translational and rotational head coordinates. The dataset's development involved sophisticated measurement and signal processing techniques, ensuring the high accuracy and reliability of the data. This dataset is suitable for research on binaural audio models, machine learning tasks, and applications requiring multi-speaker BRIRs, such as crosstalk cancellation and personal sound zone rendering.
提供机构:
普林斯顿大学
创建时间:
2024-03-19
搜集汇总
数据集介绍

构建方式
在三维音频和声学应用领域,双耳房间脉冲响应(BRIR)对于模拟或再现沉浸式声场至关重要。普林斯顿大学的3D音频和声学实验室提出的Multi-loudspeaker Binaural Room Impulse Response Dataset,通过在一个经过声学处理的听音室中使用多个扬声器,并以高分辨率测量了头部的平移和旋转坐标,捕捉了BRIR随听众位置和方向变化的特性。该数据集的构建采用了一个包含八个扬声器的线性阵列作为声源,并利用了Brüel & Kjær的头部和躯干模拟器(HATS)作为听众模型,其内置麦克风被替换为Theoretica Applied Physics的BACCH-BM Pro双耳麦克风。测量系统通过一个定制的计算机控制机械平台实现了听众的平移,并通过一个转盘实现了方位角旋转。数据采集过程中,听众在扬声器阵列中心的前后和左右方向上以0.05米的间距进行平移,并在37个不同的方位角上进行了测量,总共测量了68376个BRIR。
使用方法
使用该数据集时,研究人员首先需要了解SOFA格式,这是用于存储声学数据的标准化格式。数据集包含了经过处理的BRIR数据,以及对应的听众位置和方向坐标。研究人员可以根据需要选择特定的BRIR数据,并使用相应的声学处理软件进行进一步的分析和处理。例如,可以使用MATLAB中的SOFA Toolbox进行数据读取和处理,或者使用其他支持SOFA格式的声学软件。此外,该数据集还可以用于数据增强或性能评估,以支持需要双耳音频和多自由度听众移动的机器学习任务。
背景与挑战
背景概述
在音频领域,双耳房间脉冲响应(BRIR)是描述声源在房间内与听众的躯干、头部和耳朵之间声波相互作用特性的关键参数。BRIR广泛应用于空间音频再现、扬声器应用、声源定位、声源分离和视听学习等多个音频相关任务。BRIR不仅依赖于听众的生理特征和房间的几何及声学特性,而且随着听众在房间内的位置和方向的变化而变化,这与仅依赖于位置或方向的房间脉冲响应(RIR)和自由场头部相关脉冲响应(HRIR)不同。虽然已有多个HRIR和RIR数据集可用,但合成的BRIR在物理准确性上有所欠缺,且现有的BRIR数据集在听众位置和方向上的分辨率较低,限制了BRIR建模和插值研究。为了填补这一空白,普林斯顿大学的3D音频和应用声学实验室的Yue Qiao、Ryan Miguel Gonzales和Edgar Choueiri等人创建了一个多扬声器双耳房间脉冲响应数据集,该数据集在一个经过声学处理的听音室内使用多个扬声器进行测量,并具有高分辨率的平移和旋转头部坐标。该数据集的创建不仅为BRIR建模和插值研究提供了重要资源,还为需要多扬声器BRIR的应用,如串扰消除和个人声场,提供了宝贵的数据支持。
当前挑战
尽管该数据集在BRIR研究领域取得了显著进展,但仍面临一些挑战。首先,BRIR数据集的构建过程复杂,需要精确的测量设备和严谨的测量方法。其次,现有的BRIR数据集主要针对特定的听音室,其在不同声学环境下的适用性还有待验证。此外,BRIR的建模和插值仍然是一个开放性问题,特别是在高频范围内。最后,随着音频应用的不断发展,对BRIR数据集的需求也在不断增加,如何高效地管理和利用这些数据集是一个亟待解决的问题。
常用场景
经典使用场景
在众多音频应用中,双耳房间脉冲响应(BRIR)数据集扮演着至关重要的角色。BRIR数据集用于模拟和重现沉浸式和感知上合理的声学环境,这在耳机式音频再现中尤为关键。此外,BRIR数据集在扬声器系统中的应用也非常广泛,例如,在设计用于串扰消除、房间校正/扬声器均衡和个性化声音区域的音频滤波器时,BRIR数据集发挥着重要作用。BRIR数据集在声音源定位、声音源分离和音频-视觉学习等其他音频相关任务中也发挥着重要作用。
解决学术问题
现有的BRIR数据集通常在稀疏的听者位置和方向上进行测量,这限制了BRIR建模和插值在高频的研究,以及基于机器学习的音频应用的发展。为了解决这个问题,研究人员创建了一个包含BRIRs的数据集,这些BRIRs是在一个声学处理的聆听室中,使用多个扬声器并以高分辨率平移和旋转头部坐标进行测量的。该数据集可以应用于BRIR建模和插值的研究,以及需要多扬声器BRIRs的应用,例如串扰消除和个性化声音区域。
实际应用
BRIR数据集的实际应用场景包括:1)耳机式音频再现:通过使用BRIR数据集,可以模拟和重现沉浸式和感知上合理的声学环境;2)扬声器系统:BRIR数据集可以用于设计用于串扰消除、房间校正/扬声器均衡和个性化声音区域的音频滤波器;3)声音源定位和声音源分离:BRIR数据集可以用于这些音频相关任务。
数据集最近研究
最新研究方向
在音频处理领域,多扬声器双耳房间脉冲响应(BRIR)数据集的最新研究集中于高分辨率听者位置和旋转坐标的测量,以更精确地模拟和再现沉浸式音频环境。Princeton大学的3D Audio and Applied Acoustics Laboratory所提出的数据集,通过在经过声学处理的聆听室内使用多个扬声器,以高分辨率测量BRIR,提供了听者位置和方向的空间依赖性,这对于研究BRIR建模和插值以及开发基于机器学习的音频应用至关重要。该数据集不仅可直接应用于BRIR建模和插值研究,还可用于需要多扬声器BRIR的应用,如串扰消除和个人声音区渲染。此外,该数据集在模拟连续听者移动的头戴式耳机听觉化方面也表现出色,为未来在多自由度听者移动中需要双耳音频的机器学习任务的数据增强和性能评估提供了宝贵资源。
相关研究论文
- 1A Multi-loudspeaker Binaural Room Impulse Response Dataset with High-Resolution Translational and Rotational Head Coordinates in a Listening Room普林斯顿大学 · 2024年
以上内容由遇见数据集搜集并总结生成



