MegaBNSpeech
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/hishab-nlp/Pseudo-Labeling-for-Domain-Agnostic-Bangla-ASR
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个大规模的、与领域无关的自动语音识别(ASR)数据集,它由YouTube上的内容开发而来,涵盖了广泛的主题、说话风格、方言、噪声环境和对话场景。该数据集包含了从新闻频道、脱口秀和旅行视频博客中提取的多种音频,并已转换为16千赫兹采样率的WAV格式。该数据集规模宏大,总计53,000小时,包含42,000个视频资源,其任务是自动语音识别。
提供机构:
Authors' collection from YouTube



