方言音频转写数据集
收藏深圳市政府数据开放平台2026-02-05 更新2025-10-04 收录
下载链接:
https://opendata.sz.gov.cn/data/dataSet/toDataDetails/29200_63400002
下载链接
链接失效反馈官方服务:
资源简介:
方言音频转写数据集
Dialect Audio Transcription Dataset
提供机构:
深圳市百川数安科技有限公司
创建时间:
2025-09-30
搜集汇总
数据集介绍

背景与挑战
背景概述
方言音频转写数据集是一个包含多种方言(如湖南话、山西话、四川话、河南话等)音频文件及对应转写文本的资源,数据已进行脱敏处理以确保隐私安全。该数据集以结构化格式提供,文件总容量巨大(每个分卷约139GB),主要面向政府部门、研究机构等有条件开放,适用于公共管理服务和科学研究领域。
以上内容由遇见数据集搜集并总结生成



