five

ylacombe/dev-squim-test

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ylacombe/dev-squim-test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如音频、原始路径、开始时间、结束时间、文本、音频时长、说话者ID、书籍ID、信噪比、C50、语速、音素、STOI、SI-SDR和PESQ等。数据集分为开发集(dev)和测试集(test),并提供了每个分割的字节数和示例数。此外,还提供了数据集的下载大小和总大小。

该数据集包含多个特征,如音频、原始路径、开始时间、结束时间、文本、音频时长、说话者ID、书籍ID、信噪比、C50、语速、音素、STOI、SI-SDR和PESQ等。数据集分为开发集(dev)和测试集(test),并提供了每个分割的字节数和示例数。此外,还提供了数据集的下载大小和总大小。
提供机构:
ylacombe
原始信息汇总

数据集概述

数据集特征

  • audio: 音频数据
  • original_path: 字符串类型,原始路径
  • begin_time: 浮点数类型,开始时间
  • end_time: 浮点数类型,结束时间
  • text: 字符串类型,文本内容
  • audio_duration: 浮点数类型,音频时长
  • speaker_id: 字符串类型,说话者ID
  • book_id: 字符串类型,书籍ID
  • snr: 浮点数类型,信噪比
  • c50: 浮点数类型,C50指标
  • speaking_rate: 浮点数类型,说话速率
  • phonemes: 字符串类型,音素
  • stoi: 浮点数类型,语音可懂度指标
  • si-sdr: 浮点数类型,信号干扰比
  • pesq: 浮点数类型,语音质量评估

数据集分割

  • dev: 3807个样本,占用250843570.74字节
  • test: 3769个样本,占用247088440.096字节

数据集大小

  • 下载大小: 495689760字节
  • 数据集大小: 497932010.83599997字节

配置文件

  • config_name: default
    • dev: 路径为data/dev-*
    • test: 路径为data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作