SD-Eval
收藏SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words
SD-Eval 是一个用于多维度评估口语对话理解和生成的基准数据集。该数据集专注于副语言和环境信息,包含 7,303 个话语,总计 8.76 小时的语音数据。数据集从八个公共数据集中汇总,代表了四个视角:情感、口音、年龄和背景声音。
数据集下载
下载链接
以下是各个测试集对应的下载链接:
| Test Set | Dataset | Link |
|---|---|---|
| test-emo | RAVDESS <br> JL Corpus <br> MEAD | Link <br> Link<br>Link |
| test-acc | VCTK <br> Common Voice v16.1 | Link <br> Link |
| test-age | MyST | Link |
音频文件组织结构
音频文件应按照以下结构组织在名为 audio_data 的文件夹中:
audio_data
├── RAVDESS-Speech
│ ├── Actor_0X
│ ├── XXX.wav
│ ├── ...
│ ├── ...
├── JL_Corpus
│ ├── XXX.wav
│ ├── ...
├── MEAD
│ ├── MEAD_wav
│ ├── WXXX
│ ├── audio
│ ├── XXX
│ ├── level_X
│ ├── XXX.wav
│ ├── ...
│ ├── ...
├── VCTK
│ ├── XXX.flac
│ ├── ...
├── common_voice
│ ├── XXX.mp3
│ ├── ...
├── myst
│ ├── XXX.flac
│ ├── ...
音频文件转换
对于 MEAD 数据集中的 m4a 文件,需要转换为 wav 文件。可以使用以下 ffmpeg 脚本进行转换: bash for file in MEAD//audio///.m4a; do new_path="${file/MEAD/"MEAD_wav"}" parentdir="$(dirname "$new_path")" mkdir -p ${parentdir} ffmpeg -i "$file" -acodec pcm_s16le -ar 16000 -ac 1 "${new_path%.m4a}.wav" done
使用 Huggingface 加载数据集
可以使用 Huggingface Datasets 加载 SD-Eval 数据集。请将 audio_path 作为 data_dir 参数传入:
python from datasets import load_dataset
加载 test-emo 子集
dataset = load_dataset("amphion/SD-Eval", test-emo, data_dir=audio_path)
加载 test-acc 子集
dataset = load_dataset("amphion/SD-Eval", test-acc, data_dir=audio_path)
加载 test-age 子集
dataset = load_dataset("amphion/SD-Eval", test-age, data_dir=audio_path)
加载 test-env 子集;test-env 的音频数据在 Huggingface 上提供,无需设置 data_dir
dataset = load_dataset("amphion/SD-Eval", test-env)
引用
@article{ao2024sdeval, title = {SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words}, author = {Junyi Ao and Yuancheng Wang and Xiaohai Tian and Dekun Chen and Jun Zhang and Lu Lu and Yuxuan Wang and Haizhou Li and Zhizheng Wu}, eprint={2406.13340}, archivePrefix={arXiv}, primaryClass={cs.CL}, year={2024} }
许可证
数据集采用 CC BY-NC 4.0 许可证。代码采用 Apache 2.0 许可证。

- 1SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words香港中文大学(深圳) · 2024年



