trsav/psk-tags
收藏Hugging Face2024-07-16 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/trsav/psk-tags
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,如文件名、文本、标准化转录、音高均值、音高标准差、信噪比、C50、语速、音素、噪声、混响、语音单调性和文本描述等。数据集被分为训练集,包含420个样本,总大小为249487字节。这些字段表明数据集可能用于语音处理或语音识别相关的研究,特别是涉及音高、噪声、混响等语音质量分析的应用。
This dataset includes multiple fields such as file name, text, normalized transcription, mean pitch of utterance, standard deviation of pitch, signal-to-noise ratio, C50, speaking rate, phonemes, noise, reverberation, speech monotony, and text description. The dataset is divided into a training set containing 420 samples, with a total size of 249487 bytes. These fields suggest that the dataset may be used for research related to speech processing or speech recognition, particularly applications involving the analysis of speech quality aspects like pitch, noise, and reverberation.
提供机构:
trsav
原始信息汇总
数据集概述
数据集特征
- file_name: 文件名,数据类型为字符串。
- text: 文本内容,数据类型为字符串。
- transcription_normalized: 标准化转录文本,数据类型为字符串。
- utterance_pitch_mean: 语音音调均值,数据类型为浮点数(float32)。
- utterance_pitch_std: 语音音调标准差,数据类型为浮点数(float32)。
- snr: 信噪比,数据类型为浮点数(float64)。
- c50: 未知特征,数据类型为浮点数(float64)。
- speaking_rate: 说话速率,数据类型为字符串。
- phonemes: 音素,数据类型为字符串。
- noise: 噪声,数据类型为字符串。
- reverberation: 混响,数据类型为字符串。
- speech_monotony: 语音单调性,数据类型为字符串。
- text_description: 文本描述,数据类型为字符串。
数据集分割
- train: 训练集,包含420个样本,总大小为249487字节。
数据集大小
- 下载大小: 124669字节
- 数据集总大小: 249487字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



