five

中国人说英语手机采集语音数据【数据堂】

收藏
OpenDataLab2023-12-12 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang32
下载链接
链接失效反馈
官方服务:
资源简介:
593小时中国人说英语手机采集语音数据是由3691名中国人参与录制的10万句常用英语句子,覆盖国内江苏、山东、北京、河南等方言区,符合中国人说英语的特定口音。录音文本涵盖常用英语句子,内容丰富,领域广泛,音素均衡。593小时中国人说英语手机采集语音数据可用于改善语音识别系统对中国人说英语的识别效果。rn

The 593-hour mobile-collected spoken English speech dataset comprises 100,000 common English sentences recorded by 3,691 Chinese participants. It covers major dialect regions across China including Jiangsu, Shandong, Beijing, Henan and other areas, and reflects the unique accent of Chinese speakers of English. The transcribed texts of the recordings cover common English sentences, featuring rich content, diverse domains and balanced phonemes. This dataset can be utilized to enhance the recognition performance of speech recognition systems for Chinese-accented English.
提供机构:
shujutang
创建时间:
2023-12-12
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含593小时中国人说英语的语音数据,由3691名参与者录制10万句常用英语句子,覆盖国内多个方言区,专门用于提升语音识别系统对中国人英语口音的识别效果。数据为商业性质,仅面向企业合作购买。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务