lsnoo/CI_3y_15s_clean_50k

Name: lsnoo/CI_3y_15s_clean_50k
Creator: lsnoo
Published: 2024-06-15 07:54:29
License: 暂无描述

Hugging Face2024-06-15 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/lsnoo/CI_3y_15s_clean_50k

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个与音频文件相关的语音特征，涵盖了文件名、目标发音、常见发音、发音的分解形式（jamo）、多个语音特征（如ge_K, ar_K, pr_K, vq_K等）、语音质量指标（如HNR, nVB, perVB等）、语音持续时间、语速、停顿次数等。数据集还包含音频文件本身。训练集包含2165个样本，总大小为89987015.51168275字节。

提供机构：

lsnoo

原始信息汇总

数据集概述

数据集特征

filename: 文件名，数据类型为字符串。
tarUtt_K: 目标话语_K，数据类型为字符串。
tarPron: 目标发音，数据类型为字符串。
commonPron: 共同发音，数据类型为字符串。
tarPron_jamo: 目标发音_jamo，数据类型为字符串。
commonPron_jamo: 共同发音_jamo，数据类型为字符串。
ge_K: 几何_K，数据类型为浮点数。
ar_K: 面积_K，数据类型为浮点数。
pr_K: 周长_K，数据类型为浮点数。
vq_K: 体积_K，数据类型为浮点数。
ge_L: 几何_L，数据类型为浮点数。
ar_L: 面积_L，数据类型为浮点数。
pr_L: 周长_L，数据类型为浮点数。
vq_L: 体积_L，数据类型为浮点数。
ge_C: 几何_C，数据类型为浮点数。
ar_C: 面积_C，数据类型为浮点数。
pr_C: 周长_C，数据类型为浮点数。
vq_C: 体积_C，数据类型为浮点数。
ge_AVG: 几何平均值，数据类型为浮点数。
ar_AVG: 面积平均值，数据类型为浮点数。
pr_AVG: 周长平均值，数据类型为浮点数。
vq_AVG: 体积平均值，数据类型为浮点数。
shimmer: 闪烁，数据类型为字符串。
HNR: 谐波噪声比，数据类型为浮点数。
nVB: 音节数，数据类型为浮点数。
perVB: 音节百分比，数据类型为字符串。
med: 中位数，数据类型为字符串。
mean: 平均值，数据类型为浮点数。
std: 标准差，数据类型为字符串。
min: 最小值，数据类型为浮点数。
max: 最大值，数据类型为浮点数。
total_duration: 总时长，数据类型为浮点数。
speech_duration: 语音时长，数据类型为浮点数。
speaking_rate: 语速，数据类型为浮点数。
articulation_rate: 清晰度，数据类型为浮点数。
npause: 停顿次数，数据类型为浮点数。
asd: 平均语速，数据类型为浮点数。
phon_ratio: 音素比率，数据类型为浮点数。
pause_dur: 停顿时长，数据类型为浮点数。
CPPvoiceDet: 语音检测CPP，数据类型为浮点数。
CPPNOvoiceDet: 无语音检测CPP，数据类型为浮点数。
0 至 12: 数值特征，数据类型为浮点数。
audio: 音频数据，数据类型为音频。
index_level_0: 索引级别0，数据类型为整数。

数据集分割

train: 训练集，包含2165个样本，总大小为89987015.51168275字节。

数据集大小

下载大小: 75488524字节。
数据集总大小: 89987015.51168275字节。

配置

default: 默认配置，包含训练集数据文件路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集