five

上海方言手机采集语音数据【数据堂】

收藏
OpenDataLab2023-12-20 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang56
下载链接
链接失效反馈
官方服务:
资源简介:
1,030小时上海方言手机采集语音数据,由2,956名上海方言发音人,在安静的室内环境下的录音数据。录音内容广泛,包括多领域客户咨询、短信、数字、上海POI等。1,030小时上海方言手机采集语音数据的语料无重复,平均句长12.68字。匹配主流安卓、苹果系统手机。

This dataset contains 1,030 hours of Shanghai dialect speech data collected via mobile phones, recorded from 2,956 local Shanghai dialect speakers in quiet indoor environments. The recording content covers a wide range of scenarios, including multi-domain customer consultations, short messages, numerals, and Shanghai Points of Interest (POIs). The corpus has no duplicate samples, with an average sentence length of 12.68 Chinese characters. It is compatible with mainstream Android and Apple iOS mobile devices.
提供机构:
shujutang
创建时间:
2023-12-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含1,030小时的上海方言手机采集语音数据,由2,956名发音人在安静室内环境下录制,内容涵盖多领域咨询、短信等,语料无重复且平均句长为12.68字,适用于主流手机系统。需要注意的是,这是商业数据,仅限企业合作购买。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务