japanese-asr/whisper_transcriptions.reazonspeech.all_50.wer_10.0.vectorize
收藏Hugging Face2024-04-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/japanese-asr/whisper_transcriptions.reazonspeech.all_50.wer_10.0.vectorize
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: all
features:
- name: input_length
dtype: int64
- name: labels
sequence: int64
- name: input_features
sequence:
sequence: float32
splits:
- name: train
num_bytes: 138421101360
num_examples: 90077
download_size: 25661647227
dataset_size: 138421101360
configs:
- config_name: all
data_files:
- split: train
path: all/train-*
---
数据集信息:
配置名:all
特征:
- 名称:input_length(输入长度),数据类型:int64(64位整型)
- 名称:labels(标签),数据类型:int64序列
- 名称:input_features(输入特征),数据类型:元素为float32(32位浮点型)的嵌套序列
拆分集:
- 拆分名:train(训练集),字节占用数:138421101360,样本数量:90077
下载大小:25661647227
数据集总大小:138421101360
配置项:
- 配置名:all
数据文件:
- 拆分:train(训练集)
文件路径:all/train-*
提供机构:
japanese-asr
原始信息汇总
数据集概述
数据集配置
- 配置名称: all
数据特征
- input_length: 整数类型 (int64)
- labels: 序列类型,整数 (sequence: int64)
- input_features: 序列类型,包含子序列,浮点数 (sequence: float32)
数据分割
- 训练集 (train):
- 数据量: 90077个样本
- 存储大小: 138421101360字节
数据集大小
- 下载大小: 25661647227字节
- 总大小: 138421101360字节



