viethq5/asr_evaluation

Name: viethq5/asr_evaluation
Creator: viethq5
Published: 2024-07-15 08:31:44
License: 暂无描述

Hugging Face2024-07-15 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/viethq5/asr_evaluation

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频和转录文本信息，具体特征包括音频、转录文本、自动语音识别结果（za_asr）、词错误率（WER）、字符错误率（CER）、小写词错误率（lower_WER）、小写字符错误率（lower_CER）、来源（source）和音频ID（audio_id）。数据集分为训练集，包含1002个样本，总大小为110015985.75字节。数据集不支持长音频（测试过20分钟的音频）。

This dataset contains audio and transcript information, with specific features including audio, transcript, automatic speech recognition results (za_asr), word error rate (WER), character error rate (CER), lowercase word error rate (lower_WER), lowercase character error rate (lower_CER), source, and audio ID. The dataset is divided into a training set containing 1002 samples, with a total size of 110015985.75 bytes. The dataset does not support long audio (tested with 20-minute audio).

提供机构：

viethq5

原始信息汇总

数据集概述

数据集信息

特征

audio: 音频数据，数据类型为 audio。
transcript: 转录文本，数据类型为 string。
za_asr: ASR 输出文本，数据类型为 string。
WER: 词错误率，数据类型为 int64。
CER: 字符错误率，数据类型为 int64。
lower_WER: 小写词错误率，数据类型为 int64。
lower_CER: 小写字符错误率，数据类型为 int64。
source: 数据来源，数据类型为 string。
audio_id: 音频ID，数据类型为 string。

数据分割

train: 训练集，包含 1002 个样本，总大小为 110015985.75 字节。

数据集大小

下载大小: 109486059 字节
数据集大小: 110015985.75 字节

配置

default: 默认配置，包含训练集数据文件路径为 data/train-*。

限制

不支持长音频（测试时长为 20 分钟）。

5,000+

优质数据集

54 个

任务类型

进入经典数据集