amphion/SD-Eval

Name: amphion/SD-Eval
Creator: amphion
Published: 2024-06-21 16:53:45
License: 暂无描述

Hugging Face2024-06-21 更新2024-06-25 收录

下载链接：

https://hf-mirror.com/datasets/amphion/SD-Eval

下载链接

链接失效反馈

官方服务：

资源简介：

SD-Eval是一个基准数据集，旨在多维度评估口语对话的理解和生成。该数据集重点关注副语言和环境信息，包含了来自八个公共数据集的7,303个话语，总计8.76小时的语音数据。这些数据代表了四个视角：情感、口音、年龄和背景音。

提供机构：

amphion

原始信息汇总

SD-Eval 数据集概述

数据集基本信息

许可证: cc-by-nc-4.0
任务类别:
- 文本生成
- 问答
语言: 英语
标签:
- 口语对话生成
- 牛角面包（croissant）
规模类别: 1K<n<10K

数据集详细信息

配置名称: SD-Eval
特征:
- utt_id: 字符串类型
- transcript: 字符串类型
- audio: 音频类型，采样率为16000
- info: 字符串类型
- dataset_name: 字符串类型
- reply1: 字符串类型
- reply2: 字符串类型
- reply3: 字符串类型
- reply4: 字符串类型
- reply5: 字符串类型

数据集描述

SD-Eval 是一个用于多维度评估口语对话理解和生成的基准数据集。该数据集专注于副语言和环境信息，包含7,303个话语，总计8.76小时的语音数据。数据集汇集自八个公共数据集，代表四个视角：情感、口音、年龄和背景声音。

引用

@article{ao2024sdeval, title = {SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words}, author = {Junyi Ao and Yuancheng Wang and Xiaohai Tian and Dekun Chen and Jun Zhang and Lu Lu and Yuxuan Wang and Haizhou Li and Zhizheng Wu}, eprint={2406.13340}, archivePrefix={arXiv}, primaryClass={cs.CL}, year={2024} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集