five

Indic-High-Fidelity-MultiSpeaker-ASR

收藏
Hugging Face2026-03-14 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/humyn-labs/Indic-High-Fidelity-MultiSpeaker-ASR
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个高质量的多说话者对话音频数据集,专为多种印度语言的自动语音识别(ASR)研究而设计。数据集包含配对的音频和时间戳转录文本,涵盖自然、非脚本化的对话语音,双说话者互动,分段级别的说话者标注以及区域多样化的口音。音频文件采用WAV格式(PCM 16位),采样率为16 kHz,单声道。数据集支持包括阿萨姆语、奥里亚语、孟加拉语、博杰普尔语、恰蒂斯加尔语、古吉拉特语、哈里亚纳语、印地语、旁遮普语、马拉地语、泰米尔语、卡纳达语、马拉雅拉姆语和泰卢固语在内的多种语言。数据收集自印度多个地区的母语者,确保了口音多样性、自然对话流和真实世界对话模式。转录过程由母语者手动完成,包含时间戳分段和说话者标签。该数据集适用于ASR模型的训练和微调、对话ASR基准测试、说话者日志研究、说话者轮次检测以及多说话者建模等学术和开放研究用途。数据集采用知识共享署名4.0国际许可协议(CC BY 4.0)。
创建时间:
2026-03-03
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作