aidatatang
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/aidatatang
下载链接
链接失效反馈官方服务:
资源简介:
aidatatang语料库的内容和相应的描述包括:
语料库包含200小时的声学数据,主要是移动记录的数据。
邀请了来自中国不同口音地区的600位演讲者参与录音。
每个句子的转录准确率大于 98%。
录音在安静的室内环境中进行。
数据库按7:1:2的比例分为训练集、验证集和测试集。
语音数据编码和说话人信息等详细信息保留在元数据文件中。
还提供了分段的成绩单。
该语料库旨在支持语音识别、机器翻译、声纹识别和其他语音相关领域的研究人员。因此,语料库完全免费供学术使用。每个句子的转录准确率大于 98%。
提供机构:
OpenDataLab
创建时间:
2023-06-25



