aidatatang_1505zh
收藏OpenDataLab2026-03-29 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/aidatatang_1505zh
下载链接
链接失效反馈资源简介:
1,505小时 中文普通话语音数据集数据时长1505小时,是数据堂中文普通话语音数据库中的一部分。采集区域覆盖全国34个省级行政区域,参与录音人数达6408人,录音内容超30万条口语化句子。经过专业语音校对人员转写标注,并通过严格质量检验,句标注准确率达98%以上,是行业内句准确率的最高标准。(仅支持学术研究,未经允许禁止商用)
提供机构:
OpenDataLab
创建时间:
2023-06-25
AI搜集汇总
数据集介绍

背景与挑战
背景概述
aidatatang_1505zh是一个1,505小时的中文普通话语音数据集,覆盖全国34个省级行政区域,由6,408人录制超过30万条口语化句子,标注准确率达98%以上,适用于学术研究但禁止商用。
以上内容由AI搜集并总结生成



