five

Arabic Call Benchmark Dataset

收藏
arXiv2024-03-07 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2403.04280v1
下载链接
链接失效反馈
官方服务:
资源简介:
Arabic Call Benchmark Dataset是由Maqsam公司创建的一个专注于阿拉伯语电话通话自动语音识别(ASR)的基准数据集。该数据集包含来自13个不同国家的电话通话记录,涵盖教育、娱乐和电子商务等多个领域,特别关注客户支持和销售职位。数据集标准化为16kHz采样率,单声道,16位精度,包含从清晰到嘈杂环境的不同音频质量。通过41名注释者和13名审阅者的严格手工转录,形成了132小时的高质量标注语音数据。此数据集旨在为ASR系统提供一个全面的测试平台,以解决阿拉伯语电话通话中的语音识别挑战,推动ASR技术在阿拉伯语区域的发展和应用。
提供机构:
Maqsam
创建时间:
2024-03-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作