数据堂—516小时韩语手机采集语音数据
收藏魔搭社区2025-10-01 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/516Hours-KoreanSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
516小时韩语手机采集语音数据,录音文本包括:日常口语、各种交互类句子、家居命令、车载命令等。516小时韩语手机采集语音数据参与录音人员 1,077人,男女各占比49%、51%。一个录音人的语音时长控制在半小时左右。
This dataset contains 516 hours of Korean speech data collected via mobile phones. The associated transcripts cover daily spoken language, various interactive sentences, home automation commands, in-vehicle commands and other content types. A total of 1,077 individuals participated in the recording, with 49% male and 51% female participants. The speech duration for each individual participant is controlled to approximately 30 minutes.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含516小时通过手机采集的韩语语音数据,专用于测试韩语语音识别模型。数据格式为16kHz、16bit的未压缩WAV单声道文件,涉及1077名参与者,录音内容涵盖日常对话、交互语句及命令场景。数据集由DataTang拥有版权,属于商业数据。
以上内容由遇见数据集搜集并总结生成



