babs/multilingual-classification-dataset
收藏Hugging Face2024-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/babs/multilingual-classification-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和语言信息两个主要特征。音频特征的采样率为16000,语言特征记录了具体的语言类型。数据集主要分为训练集,包含79786个样本,总数据量约为324亿字节,下载大小约为313亿字节。
该数据集包含音频和语言信息两个主要特征。音频特征的采样率为16000,语言特征记录了具体的语言类型。数据集主要分为训练集,包含79786个样本,总数据量约为324亿字节,下载大小约为313亿字节。
提供机构:
babs
原始信息汇总
数据集信息
特征
- 音频
- 采样率: 16000
- 语言
- 数据类型: 字符串
数据分割
- 训练集
- 字节数: 32443542061.635834
- 样本数: 79786
数据大小
- 下载大小: 31344423962
- 数据集大小: 32443542061.635834
配置
- 默认配置
- 数据文件:
- 分割: 训练集
- 路径: data/train-*
- 数据文件:



