AES-Natural
收藏audiobox-aesthetics 数据集概述
数据集简介
- 统一自动评估语音、音乐和声音的质量。
安装方式
-
使用pip安装:
pip install audiobox_aesthetics
-
直接从源代码安装(需Python 3.9和Pytorch 2.2或更高版本):
pip install -e .
预训练模型
- 所有轴的模型:checkpoint.pt
使用方法
-
创建jsonl格式的文件,包含音频路径及可选的起始和结束时间。
-
使用以下命令运行预测:
audio-aes input.jsonl --ckpt "/path/to/checkpoint.pt" > output.jsonl
-
输出文件包含四个轴的预测结果:内容愉悦度(CE)、内容有用性(CU)、制作复杂度(PC)、制作质量(PQ)。
评估数据集
- 包含四个轴的美学标注分数的评估数据集。
- 数据集来源包括:LibriTTS、cv-corpus-13.0、EARS、MUSDB18、musiccaps、audioset unbalanced_train_segments、PAM。
许可
- 大部分代码遵循CC-BY 4.0协议。
- 部分代码遵循MIT协议(来自microsoft/unilm)。
引用
- 如果本仓库对您的研究有帮助,请使用以下BibTeX引用格式。
bibtex @article{tjandra2025aes, title={Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and Sound}, author={Tjandra, Andros and Wu, Yi-Chiao and Guo, Baishan and Hoffman, John and Ellis, Brian and Vyas, Apoorv and Shi, Bowen and Chen, Sanyuan and Le, Matt and Zacharov, Nick and Wood, Carleigh and Lee, Ann and Hsu, Wei-ning}, publisher={Meta AI}, year={2025}, url={https://ai.meta.com/research/publications/meta-audiobox-aesthetics-unified-automatic-quality-assessment-for-speech-music-and-sound/} }

- 1Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and SoundMeta · 2025年



