five

数据堂—359小时印尼语手机采集语音数据_朗读

收藏
魔搭社区2025-11-26 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/359Hours-IndonesianSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
359小时印尼语手机采集语音数据由496位印尼本地人员参与采集,每人约400句,录音环境安静,录音内容包括经济、娱乐、新闻、口语、数字、字母等多个领域。359小时印尼语手机采集语音数据所有文本由人工转写,准确率高

359 hours of Indonesian speech data collected via mobile phones involved 496 local Indonesian participants, with each contributor providing approximately 400 utterances. All recordings were conducted in quiet environments, and the speech content covers multiple domains including economy, entertainment, news, colloquial speech, digits and letters. All transcriptions of this dataset were manually produced, ensuring high annotation accuracy.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含359小时的印尼语手机采集语音数据,由496名本地印尼人录制,每人约400句,覆盖经济、娱乐、新闻等多个领域,录音环境安静且文本经人工转录,准确率达95%。数据格式为16kHz、16位、单声道WAV,主要用于印尼语语音识别模型的测试任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务