five

RAF

收藏
github2024-05-31 收录
下载链接:
https://github.com/facebookresearch/real-acoustic-fields
下载链接
链接失效反馈
官方服务:
资源简介:
We present the Real Acoustic Fields (RAF) dataset that captures real acoustic room data from multiple modalities. The dataset includes high-quality and densely captured room impulse response data paired with multi-view images, and precise 6DoF pose tracking data for sound emitters and listeners in the rooms.

本研究提出了真实声场(Real Acoustic Fields,RAF)数据集,该数据集可采集多模态的真实室内声学数据。数据集包含高质量、高密度采集的室内脉冲响应数据与配套的多视角图像,同时还提供了针对室内声源与听音者的精确六自由度(6DoF)位姿追踪数据。
原始信息汇总

Real Acoustic Fields 数据集概述

数据集描述

Real Acoustic Fields (RAF) 数据集是一个包含真实声学房间数据的音频-视觉数据集,由多种模态数据组成。该数据集包括高质量且密集捕捉的房间脉冲响应数据,与多视角图像配对,以及房间内声源和听众的精确6DoF姿态跟踪数据。

数据集内容

1. 房间脉冲响应 (RIR) 数据

  • 文件结构

    ├───data │ ├───000000 │ rir.wav │ rx_pos.txt │ tx_pos.txt │ ├───000001 │ : : ├───metadata │ all_rx_pos.txt │ all_tx_pos.txt

  • 文件说明

    • rir.wav:房间脉冲响应音频文件。
    • rx_pos.txt:接收器(麦克风)的3D位置(xyz)。
    • tx_pos.txt:发射器(扬声器)的3D位置和方向,方向以四元数表示。

2. 视觉数据

  • 数据来源:来自"Emptyroom"和"Furnishedroom"的数据,详情请参考Eyeful dataset

3. 3D模型

数据集下载

  • RIR数据下载
    • 使用AWS CLI进行同步下载,总大小约21.6 GB。

    • 下载命令:

      $ aws s3 sync --no-sign-request s3://fb-baas-f32eacb9-8abb-11eb-b2b8-4857dd089e15/real_acoustic_fields/rir .

许可证

本数据集遵循Creative Commons Attribution-NonCommercial 4.0 International License

引用信息

若您在研究中使用了此数据集,请使用以下BibTeX条目引用:

@inproceedings{chen2024RAF, author = { Chen, Ziyang and Gebru, Israel D. and Richardt, Christian and Kumar, Anurag and Laney, William and Owens, Andrew and Richard, Alexander}, title = {Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark}, journal = {The IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR)}, year = {2024}, }

搜集汇总
数据集介绍
main_image_url
构建方式
RAF数据集通过采集具有多模态特性的真实声学房间数据而构建。该数据集包含高质量且密集捕捉的房间脉冲响应数据,并与多视角图像、精确的6DoF声源与听者位姿追踪数据相结合,为声学房间模拟与评估提供了全面的资源。
特点
RAF数据集的特点在于其综合了音频与视觉信息,提供了房间脉冲响应数据、多视角图像以及6DoF位姿数据。这些数据不仅覆盖了声学信息,还包括了房间内部结构与布局的视觉信息,为声学与视觉的联合研究提供了独特且珍贵的资源。
使用方法
使用RAF数据集,用户首先需要通过AWS CLI下载RIR数据和相关视觉数据。数据集的结构化组织使得用户能够方便地访问房间脉冲响应数据、位置信息以及视觉数据。通过遵循数据集提供的指南,用户可以高效地利用这些数据进行声学模拟、空间音频渲染以及声学与视觉联合分析等研究任务。
背景与挑战
背景概述
Real Acoustic Fields (RAF)数据集,是一项由Chen Ziyang等研究人员于2024年提出的音频-视觉房间声学数据集及基准。该数据集旨在捕捉多模态的实际房间声学数据,包含高质量密集捕捉的房间冲激响应数据,与多视角图像以及声音发射器和接收器在房间内的精确6DoF位姿追踪数据。RAF数据集的创建,为声学建模与仿真、房间声学特性分析以及音频-视觉联合处理等领域提供了宝贵的实验资源,对相关研究具有显著的推动作用。
当前挑战
RAF数据集在构建过程中面临的挑战主要包括:1)真实环境下的房间冲激响应数据的获取,需要克服各种噪声干扰和实际操作中的技术难题;2)多模态数据的同步采集与整合,确保音频与视觉数据在时间与空间上的精确对齐;3)大规模数据处理与存储,如何高效地管理并访问这些数据集是另一个挑战。在研究领域问题上,RAF数据集解决的领域问题是音频-视觉房间声学的联合建模与理解,其挑战在于如何准确捕捉声波在复杂室内环境中的传播特性,以及如何利用视觉信息提升声学模型的性能。
常用场景
经典使用场景
在音频与视觉领域,RAF数据集的典型应用场景在于捕捉并分析实际房间内的声学特性。该数据集通过多模态方式,将高质量、密集捕捉的房间脉冲响应数据与多视角图像以及精确的6自由度位姿跟踪数据相结合,为研究声源与听者之间的声学交互提供了详实的基础。
解决学术问题
RAF数据集解决了声学领域中关于房间脉冲响应的精确建模与仿真问题,对于理解房间声学特性、音质评估、声音渲染等方面具有重大意义。其提供的详尽数据有助于学术研究者深入探究声波在真实环境中的传播与反射规律,进而推动相关算法与技术的进步。
衍生相关工作
基于RAF数据集,研究者们已经衍生出一系列相关工作,包括但不限于声学场景理解、音频处理算法的开发与测试、以及声学模型在计算机视觉任务中的应用。这些工作进一步扩展了RAF数据集的应用范围,为声学与视觉的跨领域研究提供了丰富的资源与工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作