AcousticRooms

github2025-06-01 更新2025-06-08 收录

下载链接：

https://github.com/facebookresearch/AcousticRooms

下载链接

链接失效反馈

官方服务：

资源简介：

AcousticRooms是一个大规模的合成房间脉冲响应（RIR）数据集，专为跨房间RIR预测任务设计。它包括超过30万单通道RIR，模拟自260个房间，涵盖10个类别，如公寓、礼堂、办公室和咖啡馆。每个房间具有高质量的3D空间几何形状和随机分配的材料属性，这些材料来自一个包含332种声学材料的多样化库。

AcousticRooms is a large-scale synthetic room impulse response (RIR) dataset specifically designed for cross-room RIR prediction tasks. It contains over 300,000 single-channel RIRs simulated from 260 rooms spanning 10 categories, including apartments, auditoriums, offices, and cafes. Each room features high-quality 3D spatial geometry and randomly assigned material properties sourced from a diverse library of 332 acoustic materials.

创建时间：

2025-05-28

原始信息汇总

AcousticRooms 数据集概述

数据集基本信息

名称: AcousticRooms
来源: CVPR 2025论文《Hearing Anywhere in Any Environment》
作者: 华盛顿大学、Meta、马里兰大学团队
规模: 超过30万条单通道房间脉冲响应(RIR)
房间数量: 260个
房间类型: 10类(公寓/礼堂/办公室/咖啡厅等)
材料库: 332种声学材料(11个类别)

核心特征

三维空间: 专业设计的3D房间几何结构
仿真方法: 混合声学仿真(波+几何)
多样性: 房间体积20-1000m³不等
配置: 空间有效的随机采样源-接收器配置

仿真设置

声学建模

平台: Treble声学仿真平台
低频(<710Hz): 基于波的仿真
高频(>710Hz): 基于几何的仿真
- 4阶以内: 图像源方法(5万条射线)
- 高阶: 随机射线追踪(5000条射线)
终止条件: 60dB能量衰减

设备布置

数量配置:
- 每房间10-100个全向声源
- 25-100个单声道接收器
间距约束:
- 距表面≥0.5m
- 声源间距≥1.0m
- 声源与接收器间距≥0.5m

材料分配

表面语义标注(墙壁/地板/家具等)
随机选择材料库中的具体材料
几何相似房间具有不同声学特性

数据内容

文件/目录	描述
`single_channel_ir.zip`	30万条标准化单通道RIR波形(22.05kHz采样率)
`metadata.zip`	包含声源和接收器[x,y,z]位置的JSON元数据
`depth_map.zip`	每个接收器位置的全景深度图
`room_mesh_obj_format/`	所有房间的3D网格几何(.obj格式)
`material_library/`	声学材料定义(吸收/反射系数)
`simulation_info/`	选定房间的配置文件和仿真参数

使用许可

许可证: CC BY 4.0国际许可
允许用途: 包括商业用途在内的共享和改编
要求: 需标明出处

引用格式

bibtex @inproceedings{liu2025haae, title = {Hearing Anywhere in Any Environment}, author = {Liu, Xiulong and Kumar, Anurag and Calamia, Paul and Garí, Sebastià V. Amengual and Murdock, Calvin and Ananthabhotla, Ishwarya and Robinson, Philip and Shlizerman, Eli and Ithapu, Vamsi Krishna and Gao, Ruohan}, booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)}, year = {2025}, }

搜集汇总

数据集介绍

构建方式

AcousticRooms数据集通过专业声学仿真平台Treble构建，采用混合声学建模技术，将波基仿真与几何基仿真相结合。低频段（<710Hz）采用波基仿真保证精度，高频段（>710Hz）则运用四阶图像源法与5000射线随机追踪的几何方法。数据集涵盖260个专业设计的3D房间几何体，每个房间随机配置10-100个全向声源和25-100个单耳接收器，并采用空间点采样算法确保设备间距符合声学规范。所有表面材料从包含332种真实材料的库中随机选取，赋予各房间独特的声学特性。

特点

该数据集作为目前规模最大的合成房间脉冲响应数据集，包含逾30万条单通道RIR数据，覆盖10类室内场景。其核心优势在于高度可控的声学变量：通过专业3D建模确保几何多样性，房间容积跨度达20-1000立方米；材料系统包含11大类332种实测声学材料，实现表面属性的科学组合；采用混合仿真技术生成的RIR数据精确捕捉60dB能量衰减过程。深度图与3D网格数据的同步提供，为跨模态研究创造了条件。

使用方法

研究者可通过解压单通道IR文件获取标准化RIR波形，采样率为22.05kHz。元数据JSON文件详细记录声源-接收器的三维坐标信息，支持空间声场分析。深度图数据以numpy格式存储，配合OBJ格式的3D房间网格，可实现声学与几何特征的联合建模。材料库中的吸/反射系数为声学逆向工程提供基准参数。建议使用官方提供的MATLAB/Python解析脚本处理二进制数据，注意遵守CC-BY-4.0许可要求。

背景与挑战

背景概述

AcousticRooms数据集由华盛顿大学、Meta和马里兰大学的研究团队于2025年联合推出，旨在解决声学环境建模中的跨房间脉冲响应预测问题。该数据集通过高保真混合声学仿真技术，构建了包含26种房间类型、超过30万条单通道房间脉冲响应的大规模合成数据集，其核心价值在于为计算听觉场景分析、增强现实音频渲染等前沿领域提供了标准化基准。数据集创新性地采用波导与几何混合建模方法，结合332种真实声学材料的参数化建模，显著提升了声学仿真在复杂环境中的泛化能力，被CVPR 2025收录的研究表明其在三维声场重建任务中实现了突破性进展。

当前挑战

该数据集主要应对声学环境数字化中的两大挑战：在领域问题层面，传统声学仿真难以平衡高频射线追踪与低频波动方程的计算效率，而AcousticRooms通过710Hz分频的混合算法实现了计算精度与效能的统一；在构建过程中，研究团队需解决三维几何与声学材料的参数耦合问题，特别是针对不同房间类型动态调整332种材料的散射系数，最终通过空间点采样算法确保声源-接收器配置的物理有效性。深度图与脉冲响应的多模态对齐、以及大规模并行仿真产生的300TB原始数据降采样处理，构成了数据集构建过程中的关键技术壁垒。

常用场景

经典使用场景

在声学建模与虚拟现实领域，AcousticRooms数据集为跨房间脉冲响应预测任务提供了标准化测试平台。其核心价值在于通过260个专业设计的3D房间几何结构，结合332种真实声学材料的随机分配，构建了覆盖10类场景的30万条单通道RIR样本。研究者可基于该数据集验证声场重建算法在公寓、礼堂等多样化环境中的泛化能力，特别是通过混合声学仿真技术（710Hz为界的波/几何方法）生成的RIR数据，为分析低频能量衰减与高频反射特性提供了理想素材。

实际应用

在实际工程层面，AcousticRooms支撑了多项前沿技术落地：智能家居系统利用其RIR数据优化语音助手的远场拾音性能；VR/AR开发者通过导入房间OBJ网格与深度图，快速构建具备物理真实感的声学虚拟环境；建筑信息模型（BIM）领域则借助材质声学系数库，实现新建空间的声学特性预评估。特别值得注意的是，数据集包含的接收点全景深度信息，为视觉引导的声场预测算法提供了训练-验证闭环。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集