MagicData
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MagicData
下载链接
链接失效反馈官方服务:
资源简介:
MAGICDATA普通话阅读语音语料库由MAGIC DATA开发 科技有限公司,并免费发布用于非商业用途。
语料库的内容和相应的描述包括:
语料库包含 755 小时的语音数据,即 主要是移动记录的数据。
来自中国不同口音地区的1080位发言者是 受邀参与录制。
句子转录准确率高于98%。
录音在安静的室内环境中进行。
数据库分为训练集、验证集和测试 以51:1:2的比例设置。
语音数据编码和说话人信息等详细信息是 保留在元数据文件中。
记录文本的领域是多样化的,包括交互式 问答、音乐搜索、SNS消息、家庭命令和控制等。
还提供了分段的成绩单。
该语料库旨在支持语音识别,机器方面的研究人员 翻译、说话人识别和其他语音相关领域。因此 语料库完全免费供学术使用。
提供机构:
OpenDataLab
创建时间:
2023-06-25



