上海方言手机采集语音数据【数据堂】
收藏OpenDataLab2023-12-20 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang56
下载链接
链接失效反馈官方服务:
资源简介:
1,030小时上海方言手机采集语音数据,由2,956名上海方言发音人,在安静的室内环境下的录音数据。录音内容广泛,包括多领域客户咨询、短信、数字、上海POI等。1,030小时上海方言手机采集语音数据的语料无重复,平均句长12.68字。匹配主流安卓、苹果系统手机。
This dataset contains 1,030 hours of Shanghai dialect speech data collected via mobile phones, recorded from 2,956 local Shanghai dialect speakers in quiet indoor environments. The recording content covers a wide range of scenarios, including multi-domain customer consultations, short messages, numerals, and Shanghai Points of Interest (POIs). The corpus has no duplicate samples, with an average sentence length of 12.68 Chinese characters. It is compatible with mainstream Android and Apple iOS mobile devices.
提供机构:
shujutang
创建时间:
2023-12-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含1,030小时的上海方言手机采集语音数据,由2,956名发音人在安静室内环境下录制,内容涵盖多领域咨询、短信等,语料无重复且平均句长为12.68字,适用于主流手机系统。需要注意的是,这是商业数据,仅限企业合作购买。
以上内容由遇见数据集搜集并总结生成



