数据堂—760小时越南语手机采集语音数据
收藏魔搭社区2025-11-26 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/760Hours-VietnameseSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
760小时越南语手机采集语音数据是由1751名越南人参与录制,口音正宗。录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别,内容丰富。760小时越南语手机采集语音数据的文本经过人工校对,准确率高。匹配主流安卓、苹果系统手机
The 760-hour Vietnamese mobile-collected speech dataset was recorded by 1,751 Vietnamese participants with authentic local accents. The accompanying transcripts were developed by language experts, covering multiple categories including general scenarios, interactive scenarios, in-vehicle scenarios and home scenarios, with rich and diverse content. The transcripts of this dataset have undergone manual proofreading to ensure high accuracy. It is compatible with mainstream Android and Apple iOS mobile devices.
提供机构:
maas
创建时间:
2024-04-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含760小时的越南语手机采集语音数据,专为测试越南语语音识别模型设计。数据由1751名母语者录制,覆盖多种场景,格式为16kHz单声道WAV,版权归数据堂所有,属于商业数据。
以上内容由遇见数据集搜集并总结生成



