AkhilTolani/vocals-descriptions

Name: AkhilTolani/vocals-descriptions
Creator: AkhilTolani
Published: 2024-07-09 00:16:47
License: 暂无描述

Hugging Face2024-07-09 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/AkhilTolani/vocals-descriptions

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征字段，如转录文本（transcript）、说话者ID（speaker_id）、性别（gender）、语音音调均值（utterance_pitch_mean）、语音音调标准差（utterance_pitch_std）、信噪比（snr）、C50（c50）、语速（speaking_rate）、音素（phonemes）、语音传输指数（stoi）、信号与干扰加噪声比（si-sdr）、语音质量评估（pesq）、音调（pitch）、噪声（noise）、混响（reverberation）、语音单调性（speech_monotony）和文本描述（text_description）。这些特征表明数据集可能用于语音分析、语音质量评估或语音识别等任务。数据集包含一个训练集，大小为229179351字节，包含238005个样本。

The dataset includes multiple feature fields such as transcript, speaker_id, gender, utterance_pitch_mean, utterance_pitch_std, snr, c50, speaking_rate, phonemes, stoi, si-sdr, pesq, pitch, noise, reverberation, speech_monotony, and text_description. These features suggest that the dataset may be used for speech analysis, speech quality assessment, or speech recognition tasks. The dataset contains a training set with a size of 229179351 bytes and includes 238005 samples.

提供机构：

AkhilTolani

原始信息汇总

数据集概述

数据集信息

特征

transcript: 类型为字符串
speaker_id: 类型为整数 (int64)
gender: 类型为字符串
utterance_pitch_mean: 类型为浮点数 (float32)
utterance_pitch_std: 类型为浮点数 (float32)
snr: 类型为浮点数 (float64)
c50: 类型为浮点数 (float64)
speaking_rate: 类型为字符串
phonemes: 类型为字符串
stoi: 类型为浮点数 (float64)
si-sdr: 类型为浮点数 (float64)
pesq: 类型为浮点数 (float64)
pitch: 类型为字符串
noise: 类型为字符串
reverberation: 类型为字符串
speech_monotony: 类型为字符串
text_description: 类型为字符串

数据分割

train: 包含238005个样本，总大小为229179351字节

数据集大小

下载大小: 109153918字节
数据集总大小: 229179351字节

配置

config_name: default
- data_files:
  - split: train
  - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集