ajaiswal100893/jenny-tts-6h-tagged

Name: ajaiswal100893/jenny-tts-6h-tagged
Creator: ajaiswal100893
Published: 2024-06-17 12:58:04
License: 暂无描述

Hugging Face2024-06-17 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/ajaiswal100893/jenny-tts-6h-tagged

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个音频和文本相关的特征，如文件名、文本内容、标准化转录、平均音高、音高标准差、信噪比、C50、语速、音素、噪声、混响、语音单调性和文本描述等。数据集主要用于训练，包含4000个样本，总大小为2263055字节。

This dataset includes various features related to audio and text, such as file name, text content, normalised transcription, mean pitch of utterance, standard deviation of pitch, signal-to-noise ratio, C50, speaking rate, phonemes, noise, reverberation, speech monotony, and text description. The dataset is primarily for training purposes, containing 4000 samples with a total size of 2263055 bytes.

提供机构：

ajaiswal100893

原始信息汇总

数据集概述

数据集信息

特征

file_name: 文件名，数据类型为 string
text: 文本内容，数据类型为 string
transcription_normalised: 标准化转录文本，数据类型为 string
utterance_pitch_mean: 语音平均音高，数据类型为 float32
utterance_pitch_std: 语音音高标准差，数据类型为 float32
snr: 信噪比，数据类型为 float64
c50: 未知特征，数据类型为 float64
speaking_rate: 说话速率，数据类型为 string
phonemes: 音素，数据类型为 string
noise: 噪声，数据类型为 string
reverberation: 混响，数据类型为 string
speech_monotony: 语音单调性，数据类型为 string
text_description: 文本描述，数据类型为 string

数据分割

train: 训练集，包含 4000 个样本，占用 2263055 字节

数据集大小

下载大小: 1063560 字节
数据集大小: 2263055 字节

配置

default: 默认配置，包含训练集数据文件路径 data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集