viethq5/asr_evaluation
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/viethq5/asr_evaluation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和转录文本信息,具体特征包括音频、转录文本、自动语音识别结果(za_asr)、词错误率(WER)、字符错误率(CER)、小写词错误率(lower_WER)、小写字符错误率(lower_CER)、来源(source)和音频ID(audio_id)。数据集分为训练集,包含1002个样本,总大小为110015985.75字节。数据集不支持长音频(测试过20分钟的音频)。
This dataset contains audio and transcript information, with specific features including audio, transcript, automatic speech recognition results (za_asr), word error rate (WER), character error rate (CER), lowercase word error rate (lower_WER), lowercase character error rate (lower_CER), source, and audio ID. The dataset is divided into a training set containing 1002 samples, with a total size of 110015985.75 bytes. The dataset does not support long audio (tested with 20-minute audio).
提供机构:
viethq5
原始信息汇总
数据集概述
数据集信息
特征
- audio: 音频数据,数据类型为
audio。 - transcript: 转录文本,数据类型为
string。 - za_asr: ASR 输出文本,数据类型为
string。 - WER: 词错误率,数据类型为
int64。 - CER: 字符错误率,数据类型为
int64。 - lower_WER: 小写词错误率,数据类型为
int64。 - lower_CER: 小写字符错误率,数据类型为
int64。 - source: 数据来源,数据类型为
string。 - audio_id: 音频ID,数据类型为
string。
数据分割
- train: 训练集,包含 1002 个样本,总大小为 110015985.75 字节。
数据集大小
- 下载大小: 109486059 字节
- 数据集大小: 110015985.75 字节
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。
限制
- 不支持长音频(测试时长为 20 分钟)。



