japanese-asr/whisper_transcriptions.reazonspeech.all_53.wer_10.0.vectorize
收藏Hugging Face2024-04-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/japanese-asr/whisper_transcriptions.reazonspeech.all_53.wer_10.0.vectorize
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: all
features:
- name: input_length
dtype: int64
- name: labels
sequence: int64
- name: input_features
sequence:
sequence: float32
splits:
- name: train
num_bytes: 139233987768
num_examples: 90606
download_size: 25652012624
dataset_size: 139233987768
configs:
- config_name: all
data_files:
- split: train
path: all/train-*
---
数据集信息:
配置名称:all
特征字段:
- 输入长度(input_length):数据类型为64位整型(int64)
- 标签(labels):为64位整型序列
- 输入特征(input_features):为嵌套的32位浮点型(float32)序列,即外层为序列,其每个元素均为32位浮点型序列
数据集划分:
- 划分名称:train,字节占用量:139233987768,样本数量:90606
下载大小:25652012624
数据集总大小:139233987768
配置项:
- 配置名称:all
数据文件:
- 划分名称:train,数据文件路径:all/train-*
提供机构:
japanese-asr
原始信息汇总
数据集概述
数据集配置
- 配置名称: all
数据特征
- 特征名称: input_length
- 数据类型: int64
- 特征名称: labels
- 数据类型: int64
- 序列类型: 是
- 特征名称: input_features
- 序列类型: 是
- 子序列类型: float32
- 序列类型: 是
数据分割
- 分割名称: train
- 数据大小: 139233987768字节
- 示例数量: 90606
数据集大小
- 下载大小: 25652012624字节
- 数据集总大小: 139233987768字节



