japanese-asr/whisper_transcriptions.reazonspeech.medium.wer_10.0.vectorized

Name: japanese-asr/whisper_transcriptions.reazonspeech.medium.wer_10.0.vectorized
Creator: japanese-asr
Published: 2024-03-15 15:32:06
License: 暂无描述

Hugging Face2024-03-15 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/japanese-asr/whisper_transcriptions.reazonspeech.medium.wer_10.0.vectorized

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: config_name: medium features: - name: input_length dtype: int64 - name: labels sequence: int64 - name: input_features sequence: sequence: float32 splits: - name: train num_bytes: 320730340056 num_examples: 208714 download_size: 59337474292 dataset_size: 320730340056 configs: - config_name: medium data_files: - split: train path: medium/train-* ---

数据集信息：配置名称：medium 特征项： - 名称：输入长度，数据类型：int64 - 名称：标签，数据类型：int64序列 - 名称：输入特征，数据类型：float32类型的嵌套序列数据拆分： - 拆分名称：训练集，字节数：320730340056，样本数：208714 下载大小：59337474292 数据集总大小：320730340056 配置项： - 配置名称：medium，数据文件： - 数据拆分：训练集，文件路径：medium/train-*

提供机构：

japanese-asr

原始信息汇总

数据集概述

数据集配置

配置名称: medium

数据集特征

特征名称: input_length
- 数据类型: int64
特征名称: labels
- 数据类型: sequence: int64
特征名称: input_features
- 数据类型: sequence: float32

数据集分割

分割名称: train
- 数据大小: 320730340056字节
- 示例数量: 208714

数据集大小

下载大小: 59337474292字节
总数据大小: 320730340056字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集