five

Gustav114514/work

收藏
Hugging Face2024-01-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Gustav114514/work
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于日语语音识别的微调模型,基于XLSR-53大模型,并在Common Voice 6.1、CSS10和JSUT数据集上进行了训练和验证。模型的使用需要输入16kHz采样的语音数据。

该数据集包含用于日语语音识别的微调模型,基于XLSR-53大模型,并在Common Voice 6.1、CSS10和JSUT数据集上进行了训练和验证。模型的使用需要输入16kHz采样的语音数据。
提供机构:
Gustav114514
原始信息汇总

数据集概述

基本信息

  • 语言: 日语 (ja)
  • 数据集: Common Voice
  • 指标:
    • WER (Word Error Rate)
    • CER (Character Error Rate)
  • 标签:
    • 音频
    • 自动语音识别
    • 语音
    • xlsr-fine-tuning-week
  • 许可证: Apache-2.0

模型信息

  • 模型名称: XLSR Wav2Vec2 Japanese by Jonatas Grosman
  • 任务: 语音识别 (Speech Recognition)
  • 数据集: Common Voice ja
  • 指标结果:
    • Test WER: 81.80%
    • Test CER: 20.16%

使用方法

  • 直接使用: 无需语言模型
  • 使用库: HuggingSound
  • 自定义脚本: 使用 transformers 库进行推理

评估

  • 评估脚本: 使用 datasetstransformers 库进行评估
  • 评估结果:
    • WER: 81.80%
    • CER: 20.16%

引用

  • BibTeX: bibtex @misc{grosman2021xlsr53-large-japanese, title={Fine-tuned {XLSR}-53 large model for speech recognition in {J}apanese}, author={Grosman, Jonatas}, howpublished={url{https://huggingface.co/jonatasgrosman/wav2vec2-large-xlsr-53-japanese}}, year={2021} }
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作