five

asr-malayalam/Mal_ASR_Predict_Ref_Samples

收藏
Hugging Face2024-07-19 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/asr-malayalam/Mal_ASR_Predict_Ref_Samples
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含使用Malayalam ASR模型vrclc/Whisper_small_malayalam对google/fleurs数据集的评估结果。该模型使用50小时的Malayalam语音数据进行训练,并使用google/fleurs数据集的测试集进行评估,该测试集包含Malayalam语音数据。评估了500个样本,得到的未归一化WER(%)为49.67724937425899。该数据集的主要用途是提供错误分析,帮助识别Malayalam语音识别中的常见错误和改进领域。

This dataset contains evaluation results from the Malayalam ASR model vrclc/Whisper_small_malayalam using the google/fleurs dataset. The model was trained with 50 hours of Malayalam speech data and evaluated using the test set of the google/fleurs dataset, which consists of Malayalam speech data. The evaluation of 500 samples resulted in an unnormalized WER(%): 49.67724937425899. The primary use of this dataset is to provide insight into error analysis, helping to identify general mistakes and areas for improvement in Malayalam speech recognition.
提供机构:
asr-malayalam
原始信息汇总

Malayalam ASR Reference Prediction dataset

概述

  • 数据集名称: Malayalam ASR Reference Prediction dataset
  • 任务类别: 句子相似度
  • 语言: 马拉雅拉姆语
  • 数据集规模: n<1K
  • 许可证: CC BY 4.0

详细信息

  • ASR模型: vrclc/Whisper_small_malayalam
  • 评估数据集: google/fleurs
  • 数据集用途: 用于评估vrclc/Whisper_small_malayalam模型在马拉雅拉姆语语音识别中的表现
  • 评估结果:
    • 使用google/fleurs数据集的测试集进行评估
    • 评估了500个样本,未归一化的WER(词错误率)为49.67724937425899

用途

  • 直接用途: 提供错误分析,帮助识别马拉雅拉姆语语音识别中的常见错误和改进领域
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作