日语手机采集语音数据_朗读【数据堂】
收藏OpenDataLab2023-12-20 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang58
下载链接
链接失效反馈官方服务:
资源简介:
234小时日语手机采集语音数据采集自799名日本本土发音人,在安静的室内、街道、餐馆等环境下的录音数据。录音内容广泛,包括21万句常用日语书面语及常用日语口语。234小时日语手机采集语音数据的文本转写句错误率小于5%。匹配主流安卓、苹果系统手机。
This 234-hour Japanese speech dataset was collected via mobile phones from 799 native Japanese speakers. Recordings were captured across various environments including quiet indoor spaces, streets and restaurants. The corpus contains 210,000 sentences covering both common formal written Japanese and everyday colloquial Japanese. The automatic speech recognition transcription error rate of this dataset is less than 5%. It is compatible with mainstream Android and iOS mobile devices.
提供机构:
shujutang
创建时间:
2023-12-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含234小时的日语朗读语音,由799名日本本土发音人在安静室内、街道等环境下录制,涵盖21万句常用日语书面语和口语,文本转写错误率低于5%,兼容主流手机系统,但为商业数据仅限企业合作购买。
以上内容由遇见数据集搜集并总结生成



