five

viethq5/asr_evaluation

收藏
Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/viethq5/asr_evaluation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频和转录文本信息,具体特征包括音频、转录文本、自动语音识别结果(za_asr)、词错误率(WER)、字符错误率(CER)、小写词错误率(lower_WER)、小写字符错误率(lower_CER)、来源(source)和音频ID(audio_id)。数据集分为训练集,包含1002个样本,总大小为110015985.75字节。数据集不支持长音频(测试过20分钟的音频)。

This dataset contains audio and transcript information, with specific features including audio, transcript, automatic speech recognition results (za_asr), word error rate (WER), character error rate (CER), lowercase word error rate (lower_WER), lowercase character error rate (lower_CER), source, and audio ID. The dataset is divided into a training set containing 1002 samples, with a total size of 110015985.75 bytes. The dataset does not support long audio (tested with 20-minute audio).
提供机构:
viethq5
原始信息汇总

数据集概述

数据集信息

特征

  • audio: 音频数据,数据类型为 audio
  • transcript: 转录文本,数据类型为 string
  • za_asr: ASR 输出文本,数据类型为 string
  • WER: 词错误率,数据类型为 int64
  • CER: 字符错误率,数据类型为 int64
  • lower_WER: 小写词错误率,数据类型为 int64
  • lower_CER: 小写字符错误率,数据类型为 int64
  • source: 数据来源,数据类型为 string
  • audio_id: 音频ID,数据类型为 string

数据分割

  • train: 训练集,包含 1002 个样本,总大小为 110015985.75 字节。

数据集大小

  • 下载大小: 109486059 字节
  • 数据集大小: 110015985.75 字节

配置

  • default: 默认配置,包含训练集数据文件路径为 data/train-*

限制

  • 不支持长音频(测试时长为 20 分钟)。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作