贵州工匠行30小时贵阳话语音识别数据集
收藏贵州省数据知识产权登记平台2026-04-29 更新2026-04-30 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2794&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集严格按照方言语音采集规范录制,统一音频采集参数与环境标准。通过音频降噪、杂音过滤、语音分句切割算法完成预处理,结合文本校对、口音修正、时间戳精准对齐规则开展人工标注。采用文本归一化、标签分类规整规则统一数据口径,辅以多层交叉审核与质量抽检机制,严控音频与文本匹配精度。数据结构标准化、规范化,可直接用于贵阳话语音识别模型训练、算法调试与迭代优化。
提供机构:
贵州工匠行科技有限公司
创建时间:
2026-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含30小时的贵阳话语音数据,由贵州工匠行科技有限公司自行采集和标注,专门用于方言语音识别、模型训练及算法优化。数据经过降噪、对齐和多重审核等标准化处理,可支撑政务、智能客服、文化保护等场景下的方言人机交互与本地化AI应用开发。
以上内容由遇见数据集搜集并总结生成



