japanese-asr/whisper_transcriptions.reazonspeech.all_38
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/japanese-asr/whisper_transcriptions.reazonspeech.all_38
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和对应的文本转录信息,音频采样率为16000Hz。数据集分为训练集,包含267444个样本,总大小为30405511944字节。每个样本包括名称、音频、转录和Whisper转录四个特征。
该数据集包含音频和对应的文本转录信息,音频采样率为16000Hz。数据集分为训练集,包含267444个样本,总大小为30405511944字节。每个样本包括名称、音频、转录和Whisper转录四个特征。
提供机构:
japanese-asr
原始信息汇总
数据集概述
数据集配置
- 配置名称: all
数据特征
- 名称: name
- 数据类型: string
- 音频: audio
- 数据类型:
- 采样率: 16000
- 数据类型:
- 转录文本: transcription
- 数据类型: string
- Whisper转录: whisper_transcript
- 数据类型: int64
数据分割
- 训练集: train
- 字节数: 30405511944.0
- 样本数: 267444
数据大小
- 下载大小: 30164180484
- 数据集大小: 30405511944.0
数据文件
- 配置名称: all
- 数据文件:
- 分割: train
- 路径: all/train-*
- 数据文件:



