扩展的SONICOM HRTF数据集

Name: 扩展的SONICOM HRTF数据集
Creator: 帝国理工学院伦敦设计工程学院, 英国
Published: 2025-07-07 22:38:24
License: 暂无描述

arXiv2025-07-07 更新2025-07-09 收录

下载链接：

https://transfer.ic.ac.uk:9090/#/2022 SONICOMHRTF-DATASET/

下载链接

链接失效反馈

官方服务：

资源简介：

扩展的SONICOM HRTF数据集是一个用于模拟真实世界声学环境的头部相关传输函数（HRTF）数据集。该数据集由帝国理工学院伦敦设计工程学院等机构的研究人员创建，包含300名参与者的测量数据，以及其中200名参与者的合成HRTF。数据集还包括预处理过的3D头部和耳朵扫描，以及用于HRTF合成的Mesh2HRTF软件。该数据集旨在推动个性化空间音频研究和开发，解决传统HRTF数据集在深度学习模型训练和验证方面的不足。数据集通过公开访问，为空间声学研究和听觉感知提供了重要的数据资源。

The Extended SONICOM HRTF Dataset is a head-related transfer function (HRTF) dataset intended for simulating real-world acoustic environments. It was created by researchers from institutions including the Department of Design Engineering, Imperial College London, and other relevant organizations. The dataset includes measured data from 300 participants, as well as synthesized HRTFs for 200 of these participants. It also provides preprocessed 3D head and ear scans, along with the Mesh2HRTF software used for HRTF synthesis. This dataset aims to advance research and development of personalized spatial audio, addressing the shortcomings of conventional HRTF datasets in the training and validation of deep learning models. The dataset is publicly accessible, serving as a critical data resource for spatial acoustics research and auditory perception studies.

提供机构：

帝国理工学院伦敦设计工程学院, 英国

创建时间：

2025-07-07

搜集汇总

数据集介绍

构建方式

在空间音频研究领域，高精度头部相关传输函数（HRTF）数据集的构建对于个性化听觉体验至关重要。扩展的SONICOM HRTF数据集通过融合实测与合成技术，实现了数据规模的突破性增长。研究团队采用边界元法（BEM）框架Mesh2HRTF，对300名受试者的预处理3D头部扫描进行声学仿真，其中200组数据通过计算生成。扫描数据经过严格处理流程：原始点云经ExScan Pro软件转化为水密网格，去除毛发干扰并标准化法兰克福平面对齐，最终生成包含预处理版和耳道封闭版的双版本模型。这种多模态构建方法既保留了原始解剖特征，又优化了计算效率。

特点

作为当前最全面的HRTF数据库之一，该数据集集成了300组实测数据与200组合成HRTF，覆盖0-24kHz频段793个空间采样点。其独特价值体现在三维形态数据的深度关联——每例样本均配套提供原始扫描、优化网格及人口统计学元数据。通过创新的分级网格技术，数据集在保持耳周区域高分辨率的同时，动态降低对侧计算复杂度，实现了仿真精度与效能的平衡。特别设计的耳道封闭模型有效消除了方向依赖性干扰，为HRTF合成算法提供了理想的验证基准。配套的SOFA格式音频数据与标准化元数据结构，极大提升了数据的互操作性与机器学习适用性。

使用方法

研究者可通过MIT许可证授权访问数据集，其模块化目录结构按参与者编号（PXXXX）组织，内含STL格式的预处理网格、分级网格及SOFA格式的脉冲响应数据。配套发布的Spatial Audio Metrics（SAM）Python工具箱为数据利用提供了专业支持，包含频谱失真度、双耳时间差等关键空间音频指标的自动化计算模块。使用建议分为三个层面：基础应用可直接调用实测HRTF进行听觉渲染算法开发；进阶研究可利用合成数据开展HRTF生成模型的对抗训练；深度分析则可结合3D扫描数据探索形态特征与声学特性的映射关系。数据集与工具箱的协同使用，为从传统声学测量到基于机器学习的HRTF预测研究搭建了完整的技术桥梁。

背景与挑战

背景概述

扩展的SONICOM HRTF数据集由英国帝国理工学院Dyson设计工程学院主导开发，并于2025年发布最新扩展版本，旨在推动个性化空间音频研究的发展。作为头部相关传输函数（HRTF）领域的重要资源，该数据集在2023年初版基础上新增100名受试者数据，总样本量达300例，包含实测HRTF与基于Mesh2HRTF算法合成的200例数据。数据集创新性地整合了高精度三维头耳扫描模型与预处理网格数据，为研究声波与人体形态学的交互机制提供了多模态实验材料。其配套开发的Spatial Audio Metrics工具箱通过标准化指标评估体系，显著提升了HRTF合成算法的迭代效率，目前已被24项研究引用，成为虚拟现实、增强现实及助听器开发领域的关键基准数据集。

当前挑战

该数据集致力于解决空间音频领域HRTF个性化建模的两大核心难题：传统测量方法受限于消声环境搭建成本与运动伪影干扰，导致数据采集效率低下；现有样本量难以满足深度学习模型对训练数据规模的需求。在构建过程中，研究团队面临三维扫描数据处理的技术瓶颈，包括耳廓区域点云畸变修复、水密网格生成，以及基于法兰克福平面的解剖结构对齐等挑战。尽管采用Mesh2HRTF进行HRTF合成可扩展数据规模，但算法对网格质量敏感度较高，约33%的原始扫描因耳道几何缺陷需经插值修复。此外，跨数据集测量协议差异导致的数据异构性问题，仍是阻碍HRTF研究可复现性的潜在制约因素。

常用场景

经典使用场景

在空间音频研究领域，扩展的SONICOM HRTF数据集为个性化头相关传输函数（HRTF）的建模与优化提供了重要支持。该数据集通过整合300名受试者的实测HRTF数据及200例基于Mesh2HRTF合成的HRTF，为虚拟现实、增强现实中的三维声场重建提供了高保真声学参数。其独特的预处理3D头部扫描数据，支持研究者分析耳廓形态对声波衍射的影响机制，成为空间听觉机理研究的基准数据库。

解决学术问题

该数据集有效解决了HRTF研究中的两大核心难题：其一，通过大规模合成与实测数据的并行提供，突破了传统测量方法样本量不足对机器学习模型训练的制约；其二，优化的3D扫描网格与标准化处理流程，显著降低了计算声学模拟中的形态学误差。数据集配套的SAM工具箱进一步实现了HRTF质量评估的定量化，为声学个性化研究提供了可重复的分析框架。

衍生相关工作

基于该数据集衍生的经典工作包括：Geronazzo等人开发的声学个性化挑战赛框架，推动了HRTF机器学习模型的标准化评估；Hogg团队提出的生成对抗网络升采样方法，显著提升了低分辨率HRTF的插值精度。这些成果均发表于IEEE Transactions on Audio, Speech and Language Processing等顶级期刊，形成了空间音频计算的新方法论体系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集