Nexdata/UAE_Arabic_Spontaneous_Speech_Data
收藏Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/UAE_Arabic_Spontaneous_Speech_Data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含749小时的阿联酋阿拉伯语自发语音数据集,涵盖了多个主题。所有语音音频都经过人工转录为文本内容,并且标注了说话者身份、性别等信息。该数据集可用于声纹识别模型训练、机器翻译语料库构建以及算法研究。数据格式为16kHz、16bit、单声道,内容类别包括访谈、演讲、多样性等。应用场景包括语音识别、视频字幕生成和视频内容审核。数据集的句子准确率(SAR)不低于95%。
提供机构:
Nexdata
原始信息汇总
数据集概述
基本信息
- 数据集名称: Nexdata/UAE_Arabic_Spontaneous_Speech_Data
- 任务类别: 自动语音识别
- 语言: 阿拉伯语(UAE)
描述
- 数据量: 749小时
- 内容: 涵盖多个话题的即兴阿拉伯语演讲数据
- 特征: 所有语音音频均手动转录为文本内容,包含说话人身份、性别等标注信息
- 应用: 用于声纹识别模型训练、机器翻译语料库构建及算法研究
规格
- 格式: 16kHz, 16bit, 单声道
- 内容类别: 访谈、演讲、多样性等
- 标注: 转录文本标注、说话人识别、性别标注
- 应用场景: 语音识别、视频字幕生成、视频内容审查
- 准确率: 句子准确率不低于95%
许可证
- 类型: 商业许可证



