cristibp11/common_voice_13_0_wav2vec2_preprocessed
收藏Hugging Face2023-08-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cristibp11/common_voice_13_0_wav2vec2_preprocessed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是基于Common Voice 13.0数据集,仅保留了英语和西班牙语,并移除了除训练和测试集之外的所有分割。数据预处理方式参考了特定的教程,专门用于训练Wav2Vec2模型进行语音识别。目前,该数据集仅提供西班牙语版本。
提供机构:
cristibp11
原始信息汇总
数据集概述
数据集配置
- 配置名称: es
数据集特征
- input_values: 序列类型为
float32 - input_length: 数据类型为
int64 - labels: 序列类型为
int64
数据集分割
- 训练集:
- 大小: 28416160808 字节
- 示例数量: 91374
- 测试集:
- 大小: 1946938848 字节
- 示例数量: 5286
数据集大小
- 下载大小: 30161672462 字节
- 数据集总大小: 30363099656 字节
数据文件路径
- 训练集:
es/train-* - 测试集:
es/test-*
语言
- 支持语言: 西班牙语 (es)
数据集名称
- 名称: Common Voice 13.0 - Wav2Vec2 Preprocessed



