贵州工匠行50小时四小话语音识别数据集
收藏贵州省数据知识产权登记平台2026-04-29 更新2026-04-30 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2793&type=1
下载链接
链接失效反馈官方服务:
资源简介:
数据集严格遵循方言语音采集与标注规范,统一音频采样参数与录制环境标准。采用语音分段切割、降噪滤波预处理算法优化音频质量;结合方言文本校对、语义校验、时间戳对齐规则完成精准标注。运用音频特征提取、文本归一化处理规则,统一标注口径与数据结构。通过数据抽检、交叉审核机制把控内容准确性,实现方言语音数据标准化治理,可直接适配语音识别模型训练与算法迭代需求。
提供机构:
贵州工匠行科技有限公司
创建时间:
2026-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含50小时的贵州方言(四小话)语音数据,由贵州工匠行科技有限公司自行生产,按月更新。数据严格遵循方言采集与标注规范,经过降噪、分段、校对等预处理,可直接用于方言语音识别、模型训练、智能客服等场景,支持地方特色AI应用和方言文化数字化保护。
以上内容由遇见数据集搜集并总结生成



