Fhrozen/tau_srir_db
收藏TAU Spatial Room Impulse Response Database (TAU-SRIR DB)
描述
TAU Spatial Room Impulse Response Database (TAU-SRIR DB) 包含在芬兰坦佩雷大学(TAU)各个空间中捕获的空间房间脉冲响应(SRIRs),固定接收器位置和每个房间的多个源位置,以及在同一记录点捕获的独立空间环境噪声记录。该数据集旨在用于模拟空间多通道录音,以评估和/或训练多通道处理算法在真实混响条件和多个房间中的应用。该数据库的主要特点包括:
- 以高分辨率多通道格式(32通道)捕获,可以从中导出多种更有限的应用特定格式(例如四面体阵列、圆形阵列、一阶Ambisonics、高阶Ambisonics、双耳)。
- 沿测量轨迹提取密集间隔的SRIRs,允许模拟移动源场景。
- 每个房间的多个源距离、方位角和仰角,允许模拟多源方法的复杂配置。
- 多个房间,允许在各种声学条件下评估方法,并训练旨在泛化到不同房间的方法。
数据收集
RIRs由TAU的员工在2017年12月至2018年6月以及2019年11月至2020年1月期间收集。数据收集得到了欧洲研究委员会的资助,资助协议为637422 EVERYSOUND。
数据集目标
该数据集可用于生成多通道或单声道混合物,以在真实混响条件下测试或训练方法,适用于多通道语音增强、声场景分析和机器听觉等领域。特别适合以下应用场景:
- 多房间混响条件下的单声道和多通道混响单源或多源语音,
- 多房间混响条件下的单声道和多通道多音源声事件,
- 多房间混响条件下的静态或动态场景中的单源和多源定位,
- 多房间混响条件下的静态或动态场景中的单源和多源跟踪,
- 多房间混响条件下的静态或动态场景中的声事件定位和检测。
规格
SRIRs使用Eigenmike球形麦克风阵列捕获。使用Genelec G Three扬声器播放最大长度序列(MLS)。SRIRs在STFT域中通过已知测量信号(MLS)和远场记录之间的最小二乘回归独立于每个频率获得。目前版本的SRIRs和环境噪声被下采样到24kHz以提高紧凑性。
目前发布的SRIR集在芬兰坦佩雷大学赫尔文塔校区内的九个不同室内位置记录。此外,在相同位置使用相同的IR记录设置收集了30分钟的背景噪声记录。SRIR方向和距离因房间而异。可能的方位角范围为$phiin[-180,180)$,而仰角范围大约在$ hetain[-45,45]$度之间。
房间列表
- 地下炸弹掩体中的大型开放空间,塑料涂层地板和岩石墙。通风噪声。
- 大型开放健身房空间。邻近房间使用健身器材的人群氛围。
- 小教室(PB132),小组工作桌和地毯地板。通风噪声。
- 会议室(PC226),硬地板和部分玻璃墙。通风噪声。
- 讲堂(SA203),倾斜地板和成排的桌子。通风噪声。
- 小教室(SC203),小组工作桌和地毯地板。通风噪声。
- 大教室(SE203),硬地板和成排的桌子。通风噪声。
- 讲堂(TB103),倾斜地板和成排的桌子。通风噪声。
- 会议室(TC352),硬地板和部分玻璃墙。通风噪声。
测量轨迹
测量轨迹按组组织,每组由地板上特定距离(范围)的圆形或线性轨迹指定。对于圆形轨迹,测量了两个范围,一个“近”和一个“远”,除了房间TC352,其中相同的范围测量了两次,但家具配置和门的状态不同。对于线性轨迹,也测量了两个范围,“近”和“远”,但在阵列的两侧,结果是4个独特的轨迹组,除了房间SA203,其中测量了3个范围,结果是6个轨迹组。线性轨迹组总是在同一个房间内平行。
每个轨迹组有多个测量轨迹,遵循相同的地面路径,但源在不同的高度。SRIRs从沿这些轨迹缓慢移动的源的噪声记录中提取,大约每隔1度从麦克风的角度间隔提取。这种提取方案比沿路径(例如每隔20cm)提取SRIRs更实用,使移动源的模拟更容易以大致恒定的角速度进行。
数据集结构
数据集包含一个SRIRs的文件夹(TAU-SRIR_DB),每个房间的所有SRIRs在一个_mat_文件中,例如rirs_09_tb103.mat。特定房间测量了4个轨迹组,每个轨迹组在3个不同高度,因此mat文件包含一个4x3结构的rirs数组,每个结构包含mic和foa字段。例如,选择第2个轨迹和第3个高度rirs(2,3)返回mic和foa字段,每个字段包含一个大小为[7200x4x114]的数组。该数组包含特定格式的SRIRs,排列为[samples x channels x DOAs],意味着在该特定轨迹上提取了300毫秒长(7200个样本@24kHz)的4通道RIRs,共114个位置。
文件rirdata.mat包含一些一般信息,如采样率、格式规范,最重要的是每个提取的SRIR的DOAs。这些可以在rirdata.room字段中找到,这是一个包含9个结构的数组,每个房间一个。例如,检查rirdata.room(8)返回特定房间的名称(tb103),测量年份,每个轨迹提取的SRIR数量,最后是提取的SRIR的DOAs。特定轨迹的DOAs可以检索为例如rirdata.room(8).rirs(2,3).doa_xyz,返回一个大小为[114x3]的数组。这些是前一步中为房间TB103的第2个轨迹、第3个源高度提取的114个SRIR的DOAs。
文件measinfo.mat包含每个房间的测量和记录信息。这些细节包括每个房间的名称,其矩形或梯形形状的尺寸,线性轨迹的起始和结束位置,或圆形轨迹的中心距离,每个轨迹组的源高度,目标格式,轨迹类型,记录设备,A加权环境声压级,以及测量噪声信号的最大和最小A加权声压级。坐标定义为相对于麦克风基座的原点。基于measinfo.mat中包含的信息,可以绘制围绕麦克风的轨迹的3D排列,尽管请注意,这些将是理想的圆形或线性预期轨迹,而实际DOAs从声学分析中获得的DOAs在这些理想路径周围有一些偏差。
最后,数据集包含一个空间环境噪声记录的文件夹(TAU-SNoise_DB),每个房间有一个子文件夹,包含两个格式的空间氛围录音,FOA或MIC。录音的长度在房间之间变化,从大约20分钟到30分钟不等。数据集的用户可以分割这些录音,并将它们添加到空间化的声音样本中,以所需SNR混合,或将不同段混合以增加原始录音时间以外的氛围。场景生成器的示例中演示了这种用例。
下载
文件TAU-SRIR_DB.z01,...,TAU-SRIR_DB.zip包含SRIRs和测量信息文件。
文件TAU-SNoise_DB.z01,...,TAU-SNoise_DB.zip包含环境噪声录音。
下载zip文件并使用您喜欢的压缩工具解压这些分卷zip文件。要提取分卷zip存档(命名为zip,z01,z02,...),您可以使用例如Linux或OSX终端中的以下语法:
将分卷存档合并为一个存档:
zip -s 0 split.zip --out single.zip
使用unzip提取单个存档:
unzip single.zip
许可
该数据库在自定义的开放非商业性带归属许可下发布。可以在伴随数据的LICENSE.txt文件中找到。




