five

amphion/SD-Eval

收藏
Hugging Face2024-06-21 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/amphion/SD-Eval
下载链接
链接失效反馈
官方服务:
资源简介:
SD-Eval是一个基准数据集,旨在多维度评估口语对话的理解和生成。该数据集重点关注副语言和环境信息,包含了来自八个公共数据集的7,303个话语,总计8.76小时的语音数据。这些数据代表了四个视角:情感、口音、年龄和背景音。

SD-Eval是一个基准数据集,旨在多维度评估口语对话的理解和生成。该数据集重点关注副语言和环境信息,包含了来自八个公共数据集的7,303个话语,总计8.76小时的语音数据。这些数据代表了四个视角:情感、口音、年龄和背景音。
提供机构:
amphion
原始信息汇总

SD-Eval 数据集概述

数据集基本信息

  • 许可证: cc-by-nc-4.0
  • 任务类别:
    • 文本生成
    • 问答
  • 语言: 英语
  • 标签:
    • 口语对话生成
    • 牛角面包(croissant)
  • 规模类别: 1K<n<10K

数据集详细信息

  • 配置名称: SD-Eval
  • 特征:
    • utt_id: 字符串类型
    • transcript: 字符串类型
    • audio: 音频类型,采样率为16000
    • info: 字符串类型
    • dataset_name: 字符串类型
    • reply1: 字符串类型
    • reply2: 字符串类型
    • reply3: 字符串类型
    • reply4: 字符串类型
    • reply5: 字符串类型

数据集描述

SD-Eval 是一个用于多维度评估口语对话理解和生成的基准数据集。该数据集专注于副语言和环境信息,包含7,303个话语,总计8.76小时的语音数据。数据集汇集自八个公共数据集,代表四个视角:情感、口音、年龄和背景声音。

引用

@article{ao2024sdeval, title = {SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words}, author = {Junyi Ao and Yuancheng Wang and Xiaohai Tian and Dekun Chen and Jun Zhang and Lu Lu and Yuxuan Wang and Haizhou Li and Zhizheng Wu}, eprint={2406.13340}, archivePrefix={arXiv}, primaryClass={cs.CL}, year={2024} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作