Lkhagvasurenam/common_voice_little_test
收藏Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Lkhagvasurenam/common_voice_little_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如client_id、path、audio、sentence等,并且这些特征的数据类型也被详细列出。数据集分为训练集和测试集,分别包含2275和1877个样本。此外,还提供了数据集的总下载大小和数据集大小。
该数据集包含多个特征,如client_id、path、audio、sentence等,并且这些特征的数据类型也被详细列出。数据集分为训练集和测试集,分别包含2275和1877个样本。此外,还提供了数据集的总下载大小和数据集大小。
提供机构:
Lkhagvasurenam
原始信息汇总
数据集概述
数据集配置
- 配置名称: mn
特征信息
- client_id: 字符串类型
- path: 字符串类型
- audio:
- sampling_rate: 16000
- sentence: 字符串类型
- up_votes: 64位整数类型
- down_votes: 64位整数类型
- age: 字符串类型
- gender: 字符串类型
- accent: 字符串类型
- locale: 字符串类型
- segment: 字符串类型
- variant: 字符串类型
- whisper_transcript: 序列类型,64位整数
数据分割
- 训练集:
- 名称: train
- 字节数: 96683810.05
- 样本数: 2275
- 测试集:
- 名称: test
- 字节数: 89815904.296
- 样本数: 1877
数据集大小
- 下载大小: 180268975
- 数据集大小: 186499714.34600002
数据文件
- 配置名称: mn
- 训练集路径: mn/train-*
- 测试集路径: mn/test-*



