苏州话方言自由对话数据库
收藏江苏数据交易所2025-06-13 更新2026-01-30 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=994
下载链接
链接失效反馈官方服务:
资源简介:
【应用领域】 数字金融、数字医疗、工业互联、能源互联、智慧出行、信息技术等【来源行业】 人工智能【数据主题】 方言数据【产品类型】 语音数据包【产品描述】 该数据为吴语方言自由对话数据,可用于语音识别系统训练、测试、语音分析、口音研究等多种用途。主要采集人群为:姑苏区、工业园区、相城区、高新区、吴中区。字正:97%以上。【有效时长】 200小时【录制人数】 450人【音频格式】 采样率 16k Hz,采样精度 16bit,单通道,未压缩 wav【人群比例】男女比例(1:1)【采集设备】智能手机,基于 Android 、IOS 系统的多种品牌型号手机进行录制
Application Fields: Digital Finance, Digital Healthcare, Industrial Internet, Energy Internet, Smart Mobility, Information Technology
Source Industry: Artificial Intelligence
Data Theme: Dialect Data
Product Type: Voice Data Package
Product Description: This dataset comprises free conversational data in Wu dialect, which can be used for various applications including speech recognition system training and testing, speech analysis, accent research and more. The majority of the recording speakers are from Gusu District, Industrial Park, Xiangcheng District, High-tech Zone and Wuzhong District, with a pronunciation accuracy rate of over 97%.
Effective Duration: 200 hours
Number of Recording Speakers: 450
Audio Format: Sampling rate 16 kHz, sampling bit depth 16-bit, single-channel, uncompressed WAV
Population Proportion: Male-to-female ratio of 1:1
Collection Equipment: Smartphones of various brands and models running Android and iOS operating systems
提供机构:
苏州核数聚信息科技有限公司
创建时间:
2025-06-13
搜集汇总
背景与挑战
背景概述
该数据集是一个高质量的苏州话方言自由对话语音数据库,包含200小时的录音,由450名来自姑苏区、工业园区等区域的说话者录制,男女比例为1:1。音频采用16k Hz采样率、16bit精度的未压缩wav格式,适用于语音识别系统训练、测试以及方言口音研究。
以上内容由遇见数据集搜集并总结生成



