lsnoo/CI_3y_15s_clean_50k
收藏Hugging Face2024-06-15 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/lsnoo/CI_3y_15s_clean_50k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个与音频文件相关的语音特征,涵盖了文件名、目标发音、常见发音、发音的分解形式(jamo)、多个语音特征(如ge_K, ar_K, pr_K, vq_K等)、语音质量指标(如HNR, nVB, perVB等)、语音持续时间、语速、停顿次数等。数据集还包含音频文件本身。训练集包含2165个样本,总大小为89987015.51168275字节。
该数据集包含多个与音频文件相关的语音特征,涵盖了文件名、目标发音、常见发音、发音的分解形式(jamo)、多个语音特征(如ge_K, ar_K, pr_K, vq_K等)、语音质量指标(如HNR, nVB, perVB等)、语音持续时间、语速、停顿次数等。数据集还包含音频文件本身。训练集包含2165个样本,总大小为89987015.51168275字节。
提供机构:
lsnoo
原始信息汇总
数据集概述
数据集特征
- filename: 文件名,数据类型为字符串。
- tarUtt_K: 目标话语_K,数据类型为字符串。
- tarPron: 目标发音,数据类型为字符串。
- commonPron: 共同发音,数据类型为字符串。
- tarPron_jamo: 目标发音_jamo,数据类型为字符串。
- commonPron_jamo: 共同发音_jamo,数据类型为字符串。
- ge_K: 几何_K,数据类型为浮点数。
- ar_K: 面积_K,数据类型为浮点数。
- pr_K: 周长_K,数据类型为浮点数。
- vq_K: 体积_K,数据类型为浮点数。
- ge_L: 几何_L,数据类型为浮点数。
- ar_L: 面积_L,数据类型为浮点数。
- pr_L: 周长_L,数据类型为浮点数。
- vq_L: 体积_L,数据类型为浮点数。
- ge_C: 几何_C,数据类型为浮点数。
- ar_C: 面积_C,数据类型为浮点数。
- pr_C: 周长_C,数据类型为浮点数。
- vq_C: 体积_C,数据类型为浮点数。
- ge_AVG: 几何平均值,数据类型为浮点数。
- ar_AVG: 面积平均值,数据类型为浮点数。
- pr_AVG: 周长平均值,数据类型为浮点数。
- vq_AVG: 体积平均值,数据类型为浮点数。
- shimmer: 闪烁,数据类型为字符串。
- HNR: 谐波噪声比,数据类型为浮点数。
- nVB: 音节数,数据类型为浮点数。
- perVB: 音节百分比,数据类型为字符串。
- med: 中位数,数据类型为字符串。
- mean: 平均值,数据类型为浮点数。
- std: 标准差,数据类型为字符串。
- min: 最小值,数据类型为浮点数。
- max: 最大值,数据类型为浮点数。
- total_duration: 总时长,数据类型为浮点数。
- speech_duration: 语音时长,数据类型为浮点数。
- speaking_rate: 语速,数据类型为浮点数。
- articulation_rate: 清晰度,数据类型为浮点数。
- npause: 停顿次数,数据类型为浮点数。
- asd: 平均语速,数据类型为浮点数。
- phon_ratio: 音素比率,数据类型为浮点数。
- pause_dur: 停顿时长,数据类型为浮点数。
- CPPvoiceDet: 语音检测CPP,数据类型为浮点数。
- CPPNOvoiceDet: 无语音检测CPP,数据类型为浮点数。
- 0 至 12: 数值特征,数据类型为浮点数。
- audio: 音频数据,数据类型为音频。
- index_level_0: 索引级别0,数据类型为整数。
数据集分割
- train: 训练集,包含2165个样本,总大小为89987015.51168275字节。
数据集大小
- 下载大小: 75488524字节。
- 数据集总大小: 89987015.51168275字节。
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



