five

aidatatang

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/aidatatang
下载链接
链接失效反馈
官方服务:
资源简介:
aidatatang语料库的内容和相应的描述包括: 语料库包含200小时的声学数据,主要是移动记录的数据。 邀请了来自中国不同口音地区的600位演讲者参与录音。 每个句子的转录准确率大于 98%。 录音在安静的室内环境中进行。 数据库按7:1:2的比例分为训练集、验证集和测试集。 语音数据编码和说话人信息等详细信息保留在元数据文件中。 还提供了分段的成绩单。 该语料库旨在支持语音识别、机器翻译、声纹识别和其他语音相关领域的研究人员。因此,语料库完全免费供学术使用。每个句子的转录准确率大于 98%。
提供机构:
OpenDataLab
创建时间:
2023-06-25
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作