AdoCleanCode/vctkmfa
收藏Hugging Face2025-12-04 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/AdoCleanCode/vctkmfa
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: transcript
dtype: string
- name: words
list:
- name: word
dtype: string
- name: start
dtype: float64
- name: end
dtype: float64
- name: phonemes
list:
- name: phoneme
dtype: string
- name: start
dtype: float64
- name: end
dtype: float64
splits:
- name: batch_001
num_bytes: 2177637689.0
num_examples: 20000
- name: batch_002
num_bytes: 2172206104.0
num_examples: 20000
- name: batch_003
num_bytes: 462351208.625
num_examples: 4283
download_size: 4650614432
dataset_size: 4812195001.625
configs:
- config_name: default
data_files:
- split: batch_001
path: data/batch_001-*
- split: batch_002
path: data/batch_002-*
- split: batch_003
path: data/batch_003-*
---
数据集信息:
特征:
- 名称:id
数据类型:字符串
- 名称:audio
数据类型:
音频:
采样率:16000
- 名称:transcript
数据类型:字符串
- 名称:words
数据类型:列表,其子项包含:
- 子项名称:word,数据类型:字符串
- 子项名称:start,数据类型:64位浮点数(float64)
- 子项名称:end,数据类型:64位浮点数(float64)
- 名称:phonemes
数据类型:列表,其子项包含:
- 子项名称:phoneme,数据类型:字符串
- 子项名称:start,数据类型:64位浮点数(float64)
- 子项名称:end,数据类型:64位浮点数(float64)
数据划分:
- 名称:batch_001
字节数:2177637689.0
样本数量:20000
- 名称:batch_002
字节数:2172206104.0
样本数量:20000
- 名称:batch_003
字节数:462351208.625
样本数量:4283
下载大小:4650614432
数据集总大小:4812195001.625
配置项:
- 配置名称:default
数据文件:
- 划分:batch_001
路径:data/batch_001-*
- 划分:batch_002
路径:data/batch_002-*
- 划分:batch_003
路径:data/batch_003-*
提供机构:
AdoCleanCode



