Open Dataset of Audio Quality (ODAQ)

Name: Open Dataset of Audio Quality (ODAQ)
Creator: Fraunhofer Institute for Integrated Circuits IIS, Erlangen, Germany; Ball State University, Muncie, USA; Netflix, Inc., Los Gatos, USA
Published: 2025-04-01 20:51:12
License: 暂无描述

arXiv2025-04-01 更新2024-06-21 收录

下载链接：

https://github.com/Fraunhofer-IIS/ODAQ/

下载链接

链接失效反馈

官方服务：

资源简介：

ODAQ是一个开放音频质量数据集，由Fraunhofer IIS、Ball State University和Netflix共同创建。该数据集包含经过不同信号处理方法处理后的音频材料及其对应的主观评分结果，旨在解决公开可用音频数据集稀缺的问题。数据集涵盖多种信号属性，包括音乐、广播类内容和易激发特定信号退化的临界内容。通过主观测试，该数据集目前已扩展至包含三个国际实验室的42名听众提供的10080个主观评分。

ODAQ is an open audio quality dataset co-created by Fraunhofer IIS, Ball State University and Netflix. This dataset contains audio materials processed with various signal processing methods and their corresponding subjective ratings, aiming to address the scarcity of publicly available audio datasets. The dataset covers multiple signal attributes, including music, broadcast content, and critical content that is prone to specific signal degradations. Through subjective listening tests, the dataset has now been expanded to include 10,080 subjective ratings provided by 42 listeners from three international laboratories.

提供机构：

Fraunhofer Institute for Integrated Circuits IIS, Erlangen, Germany; Ball State University, Muncie, USA; Netflix, Inc., Los Gatos, USA

创建时间：

2025-04-01

搜集汇总

数据集介绍

构建方式

在音频质量评估领域，公开可用的带有主观质量评分的音频数据集一直较为稀缺。ODAQ数据集的构建采用了系统化的方法，首先精选了25段涵盖音乐、广播类内容及关键信号的音频素材，确保其具有宽松的许可协议。这些素材经过六种信号处理方法的处理，每种方法生成五个质量等级的信号。主观测试采用MUSHRA方法，由来自三个国际实验室的42名经过专业训练的听评员完成，最终收集了10080个主观评分。数据集构建过程中特别注重信号退化类型的可控性，并通过调整参数确保质量等级在评分量表中均匀分布。

使用方法

该数据集主要服务于音频质量评估领域的研究与应用。研究人员可利用ODAQ进行客观质量指标的开发与验证，通过将算法预测结果与数据集中的主观评分进行相关性分析来评估算法性能。使用时应首先了解数据集的组成结构，包括原始信号、处理后的信号及对应的主观评分。数据集提供的Python工具包可辅助完成信号加载、评分统计等基础操作。对于新型质量评估算法的开发，建议采用交叉验证的方式，利用数据集提供的多种处理类型全面测试算法性能。此外，数据集也可用于训练基于机器学习的质量预测模型。

背景与挑战

背景概述

Open Dataset of Audio Quality (ODAQ)是由Fraunhofer集成电路研究所、Ball State University及Netflix等机构的研究团队于2024年推出的开放音频质量数据集，旨在解决音频质量评估领域缺乏公开主观评分数据的核心问题。该数据集包含六种信号处理方法在五个质量等级下处理的音频样本，以及对应的主观听力测试结果，采用宽松许可协议以促进学术共享。作为首个整合国际实验室42名专家听众10080份评分的大规模开放资源，ODAQ不仅为客观音频质量指标的验证提供基准，更推动了心理声学研究的可重复性发展。其创新性体现在通过系统化听众训练实现非专家与专家评分的一致性，为跨实验室研究建立了方法论范本。

当前挑战

ODAQ面临的挑战主要体现在两方面：在领域问题层面，音频质量评估需克服主观感知与客观指标间的语义鸿沟，尤其需解决不同信号类型（如纯音与混合内容）对失真敏感度的显著差异，例如预回声(PE)和未掩蔽噪声(UN)在混合内容中评分偏移达20 MUSHRA点；在构建过程中，团队需平衡版权限制与数据多样性，通过严格的信号筛选和Mid-Side立体声处理来规避空间伪影，同时调整失真参数以优化质量等级的均匀分布。此外，听众训练方法差异引发的评分偏差（如锚点条件认知导致的10分偏移）揭示了主观测试标准化协议亟待完善。

常用场景

经典使用场景

在音频质量评估领域，ODAQ数据集被广泛用于验证和基准测试客观音频质量指标的预测性能。通过提供经过六种不同信号处理方法处理的音频材料及其对应的主观质量评分，ODAQ为研究人员提供了一个标准化的测试平台。特别是在音频编码和源分离技术的研究中，ODAQ的多样化音频内容和多质量级别设计使其成为评估算法性能的理想选择。

解决学术问题

ODAQ数据集解决了音频质量评估研究中公开数据集稀缺的问题。通过提供包含主观评分的开放数据集，ODAQ使得研究人员能够进行可重复的实验，并比较不同客观质量指标的预测能力。此外，ODAQ还支持对音频编码伪影和源分离效果的深入研究，为音频信号处理领域的算法优化提供了重要参考。

实际应用

在实际应用中，ODAQ数据集被用于优化广播和流媒体服务的音频质量。例如，电视和流媒体平台可以利用ODAQ中的对话增强（DE）数据来改进语音清晰度，从而提升用户体验。此外，音频编码器的开发者可以通过ODAQ中的多质量级别数据来调整编码参数，以实现更高效的音频压缩。

数据集最近研究