mesolitica/noisy-join-mixed-asr
收藏Hugging Face2023-03-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mesolitica/noisy-join-mixed-asr
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Noisy join mixed ASR,解决了常见ASR数据集中的问题,即每个音频样本都是单语言的。通过使用ASR和Force Alignment模型,可以生成多语言的音频样本。生成样本的总时长约为601小时。
该数据集名为Noisy join mixed ASR,解决了常见ASR数据集中的问题,即每个音频样本都是单语言的。通过使用ASR和Force Alignment模型,可以生成多语言的音频样本。生成样本的总时长约为601小时。
提供机构:
mesolitica
原始信息汇总
Noisy join mixed ASR 数据集概述
数据集特点
- 多语言音频样本:该数据集通过ASR(自动语音识别)和Force Alignment模型生成了包含多语言的音频样本。
- 样本时长:生成的音频样本总时长约为601小时。
相关资源
- Notebooks:提供了用于数据处理的Notebooks,地址为 https://github.com/huseinzol05/malaya-speech/tree/master/data/noisy-join-mixed-asr。
示例图像
- 数据集包含的示例图像展示了多语言音频样本的生成过程。



