四川方言手机采集语音数据【数据堂】
收藏OpenDataLab2023-12-20 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang52
下载链接
链接失效反馈官方服务:
资源简介:
794小时四川方言手机采集语音数据采集自2,507名四川发音人,在安静的室内环境下的录音数据。录音内容广泛,覆盖日常短信及多领域客户咨询。句子平均重复次数1.3次,平均句长12.5字。794小时四川方言手机采集语音数据由四川本地人参与质检校对,文本转写更精准。匹配主流安卓、苹果系统手机。
This 794-hour mobile-collected Sichuan dialect speech dataset was sourced from 2,507 local Sichuan speakers, with all recordings made in quiet indoor environments. The recorded content spans diverse scenarios including daily text messaging contexts and multi-domain customer inquiries. The average repetition count per sentence is 1.3 times, with an average sentence length of 12.5 Chinese characters. This dataset was proofread and quality-checked by local Sichuan natives, ensuring more accurate text transcriptions. It is compatible with mainstream Android and Apple iOS smartphones.
提供机构:
shujutang
创建时间:
2023-12-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含794小时四川方言手机采集语音数据,由2,507名四川发音人在安静室内录制,内容涵盖日常短信和客户咨询,句子平均重复1.3次、平均长度12.5字,经过本地人质检校对,匹配主流安卓和苹果手机系统。数据为商业用途,仅限企业合作购买。
以上内容由遇见数据集搜集并总结生成



