japanese-asr/whisper_transcriptions.reazonspeech.all_20.wer_10.0.vectorize
收藏Hugging Face2024-04-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/japanese-asr/whisper_transcriptions.reazonspeech.all_20.wer_10.0.vectorize
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含训练集,共有90145个示例,总大小为138525587632字节。数据集的特征包括输入长度(int64类型)、标签(int64序列)和输入特征(float32的二维序列)。数据集的下载大小为25633877076字节。数据文件路径为all/train-*。
数据集信息:
配置名称:all
特征:
- 名称:输入长度(input_length),数据类型:64位整数(int64)
- 名称:标签(labels),数据类型:64位整数序列
- 名称:输入特征(input_features),数据类型为两层嵌套序列,内层元素为32位浮点数(float32)
数据拆分:
- 拆分名称:训练集(train),占用字节数:138525587632,样本总数:90145
下载总大小:25633877076 字节
数据集存储总大小:138525587632 字节
配置项:
- 配置名称:all,数据文件:
- 数据拆分:训练集(train),文件路径:all/train-*
提供机构:
japanese-asr
原始信息汇总
数据集概述
数据集配置
- 配置名称: all
数据特征
- 特征名称: input_length
- 数据类型: int64
- 特征名称: labels
- 数据类型: sequence: int64
- 特征名称: input_features
- 数据类型: sequence: float32
数据分割
- 分割名称: train
- 数据大小: 138525587632字节
- 样本数量: 90145
数据集大小
- 下载大小: 25633877076字节
- 总数据大小: 138525587632字节



