khof312/mf_cv16_sw_voice2
收藏Hugging Face2024-07-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/khof312/mf_cv16_sw_voice2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Mozilla Common Voice 16.1的一个子集,专注于斯瓦希里语的训练,特别是ID为7ec265470aa1c06d5b156e0c67c5014cfaf580e7074798f11787f82cbc3fe0ef6aefe2b969e827a41486dc4f0c034b7444ad184067378600ad5f2b9656e2a929的说话者。数据集包含多个特征,如client_id、audio、sentence、up_votes、down_votes、age、gender、accent、locale、segment、variant和path。训练集包含432个示例,总大小为13624653字节。
该数据集是Mozilla Common Voice 16.1的一个子集,专注于斯瓦希里语的训练,特别是ID为7ec265470aa1c06d5b156e0c67c5014cfaf580e7074798f11787f82cbc3fe0ef6aefe2b969e827a41486dc4f0c034b7444ad184067378600ad5f2b9656e2a929的说话者。数据集包含多个特征,如client_id、audio、sentence、up_votes、down_votes、age、gender、accent、locale、segment、variant和path。训练集包含432个示例,总大小为13624653字节。
提供机构:
khof312
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集特征
- client_id: 字符串
- audio: 音频,采样率为16000
- sentence: 字符串
- up_votes: 整数,int64类型
- down_votes: 整数,int64类型
- age: 字符串
- gender: 字符串
- accent: 字符串
- locale: 字符串
- segment: 字符串
- variant: 字符串
- path: 字符串
数据集分割
- 名称: train
- 字节数: 3293020.0
- 示例数: 100
数据集大小
- 下载大小: 3270531
- 数据集大小: 3293020.0



