Arabic Call Benchmark Dataset
收藏arXiv2024-03-07 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2403.04280v1
下载链接
链接失效反馈官方服务:
资源简介:
Arabic Call Benchmark Dataset是由Maqsam公司创建的一个专注于阿拉伯语电话通话自动语音识别(ASR)的基准数据集。该数据集包含来自13个不同国家的电话通话记录,涵盖教育、娱乐和电子商务等多个领域,特别关注客户支持和销售职位。数据集标准化为16kHz采样率,单声道,16位精度,包含从清晰到嘈杂环境的不同音频质量。通过41名注释者和13名审阅者的严格手工转录,形成了132小时的高质量标注语音数据。此数据集旨在为ASR系统提供一个全面的测试平台,以解决阿拉伯语电话通话中的语音识别挑战,推动ASR技术在阿拉伯语区域的发展和应用。
提供机构:
Maqsam
创建时间:
2024-03-07



