amphion/SD-Eval
收藏Hugging Face2024-06-21 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/amphion/SD-Eval
下载链接
链接失效反馈官方服务:
资源简介:
SD-Eval是一个基准数据集,旨在多维度评估口语对话的理解和生成。该数据集重点关注副语言和环境信息,包含了来自八个公共数据集的7,303个话语,总计8.76小时的语音数据。这些数据代表了四个视角:情感、口音、年龄和背景音。
SD-Eval是一个基准数据集,旨在多维度评估口语对话的理解和生成。该数据集重点关注副语言和环境信息,包含了来自八个公共数据集的7,303个话语,总计8.76小时的语音数据。这些数据代表了四个视角:情感、口音、年龄和背景音。
提供机构:
amphion
原始信息汇总
SD-Eval 数据集概述
数据集基本信息
- 许可证: cc-by-nc-4.0
- 任务类别:
- 文本生成
- 问答
- 语言: 英语
- 标签:
- 口语对话生成
- 牛角面包(croissant)
- 规模类别: 1K<n<10K
数据集详细信息
- 配置名称: SD-Eval
- 特征:
- utt_id: 字符串类型
- transcript: 字符串类型
- audio: 音频类型,采样率为16000
- info: 字符串类型
- dataset_name: 字符串类型
- reply1: 字符串类型
- reply2: 字符串类型
- reply3: 字符串类型
- reply4: 字符串类型
- reply5: 字符串类型
数据集描述
SD-Eval 是一个用于多维度评估口语对话理解和生成的基准数据集。该数据集专注于副语言和环境信息,包含7,303个话语,总计8.76小时的语音数据。数据集汇集自八个公共数据集,代表四个视角:情感、口音、年龄和背景声音。
引用
@article{ao2024sdeval, title = {SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words}, author = {Junyi Ao and Yuancheng Wang and Xiaohai Tian and Dekun Chen and Jun Zhang and Lu Lu and Yuxuan Wang and Haizhou Li and Zhizheng Wu}, eprint={2406.13340}, archivePrefix={arXiv}, primaryClass={cs.CL}, year={2024} }



