RAF
收藏Real Acoustic Fields 数据集概述
数据集描述
Real Acoustic Fields (RAF) 数据集是一个包含真实声学房间数据的音频-视觉数据集,由多种模态数据组成。该数据集包括高质量且密集捕捉的房间脉冲响应数据,与多视角图像配对,以及房间内声源和听众的精确6DoF姿态跟踪数据。
数据集内容
1. 房间脉冲响应 (RIR) 数据
-
文件结构:
├───data │ ├───000000 │ rir.wav │ rx_pos.txt │ tx_pos.txt │ ├───000001 │ : : ├───metadata │ all_rx_pos.txt │ all_tx_pos.txt
-
文件说明:
rir.wav:房间脉冲响应音频文件。rx_pos.txt:接收器(麦克风)的3D位置(xyz)。tx_pos.txt:发射器(扬声器)的3D位置和方向,方向以四元数表示。
2. 视觉数据
- 数据来源:来自"Emptyroom"和"Furnishedroom"的数据,详情请参考Eyeful dataset。
3. 3D模型
- 格式:OBJ格式,从全分辨率JPEG图像导出。
- 下载链接:
数据集下载
- RIR数据下载:
-
使用AWS CLI进行同步下载,总大小约21.6 GB。
-
下载命令:
$ aws s3 sync --no-sign-request s3://fb-baas-f32eacb9-8abb-11eb-b2b8-4857dd089e15/real_acoustic_fields/rir .
-
许可证
本数据集遵循Creative Commons Attribution-NonCommercial 4.0 International License。
引用信息
若您在研究中使用了此数据集,请使用以下BibTeX条目引用:
@inproceedings{chen2024RAF, author = { Chen, Ziyang and Gebru, Israel D. and Richardt, Christian and Kumar, Anurag and Laney, William and Owens, Andrew and Richard, Alexander}, title = {Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark}, journal = {The IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR)}, year = {2024}, }




