japanese-asr/whisper_transcriptions.reazonspeech.all_24.wer_10.0
收藏Hugging Face2024-04-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/japanese-asr/whisper_transcriptions.reazonspeech.all_24.wer_10.0
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: all
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: text
dtype: string
- name: whisper_transcript
sequence: int64
- name: input_length
dtype: int64
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 12605063764.0
num_examples: 90372
download_size: 12402297121
dataset_size: 12605063764.0
configs:
- config_name: all
data_files:
- split: train
path: all/train-*
---
dataset_info:
config_name: all
features:
- name: 音频(audio)
dtype:
audio:
sampling_rate: 16000 赫兹
- name: 文本(text)
dtype: 字符串(string)
- name: Whisper 转录结果(whisper_transcript)
sequence: int64
- name: 输入长度(input_length)
dtype: int64
- name: 标签(labels)
sequence: int64
splits:
- name: 训练集(train)
num_bytes: 12605063764.0
num_examples: 90372
download_size: 12402297121
dataset_size: 12605063764.0
configs:
- config_name: all
data_files:
- split: 训练集(train)
path: all/train-*
提供机构:
japanese-asr
原始信息汇总
数据集概述
数据集配置
- 配置名称: all
数据特征
-
音频 (
audio)- 数据类型: 音频
- 采样率: 16000
-
文本 (
text)- 数据类型: 字符串
-
自动语音识别转录 (
whisper_transcript)- 数据类型: 整数序列 (
int64)
- 数据类型: 整数序列 (
-
输入长度 (
input_length)- 数据类型: 整数 (
int64)
- 数据类型: 整数 (
-
标签 (
labels)- 数据类型: 整数序列 (
int64)
- 数据类型: 整数序列 (
数据集分割
- 训练集 (
train)- 示例数量: 90372
- 数据大小: 12605063764.0 字节
数据集大小
- 下载大小: 12402297121 字节
- 数据集总大小: 12605063764.0 字节



