Gustav114514/work
收藏Hugging Face2024-01-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Gustav114514/work
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于日语语音识别的微调模型,基于XLSR-53大模型,并在Common Voice 6.1、CSS10和JSUT数据集上进行了训练和验证。模型的使用需要输入16kHz采样的语音数据。
该数据集包含用于日语语音识别的微调模型,基于XLSR-53大模型,并在Common Voice 6.1、CSS10和JSUT数据集上进行了训练和验证。模型的使用需要输入16kHz采样的语音数据。
提供机构:
Gustav114514
原始信息汇总
数据集概述
基本信息
- 语言: 日语 (ja)
- 数据集: Common Voice
- 指标:
- WER (Word Error Rate)
- CER (Character Error Rate)
- 标签:
- 音频
- 自动语音识别
- 语音
- xlsr-fine-tuning-week
- 许可证: Apache-2.0
模型信息
- 模型名称: XLSR Wav2Vec2 Japanese by Jonatas Grosman
- 任务: 语音识别 (Speech Recognition)
- 数据集: Common Voice ja
- 指标结果:
- Test WER: 81.80%
- Test CER: 20.16%
使用方法
- 直接使用: 无需语言模型
- 使用库: HuggingSound
- 自定义脚本: 使用
transformers库进行推理
评估
- 评估脚本: 使用
datasets和transformers库进行评估 - 评估结果:
- WER: 81.80%
- CER: 20.16%
引用
- BibTeX: bibtex @misc{grosman2021xlsr53-large-japanese, title={Fine-tuned {XLSR}-53 large model for speech recognition in {J}apanese}, author={Grosman, Jonatas}, howpublished={url{https://huggingface.co/jonatasgrosman/wav2vec2-large-xlsr-53-japanese}}, year={2021} }



