数据堂—500小时韩语自然对话手机采集语音数据
收藏魔搭社区2025-12-26 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/500Hours-KoreanConversationalSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
500小时韩语自然对话手机采集语音数据由约700名韩国发音人参与录制,以自然方式进行面对面交流,针对指定的多个话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。300小时韩语自然对话手机采集语音数据由人工转写文本,准确率高。
500-hour Korean natural conversational speech data was collected via mobile phones, with approximately 700 Korean speakers participating as recorders. The recordings feature natural face-to-face interactions, free discussions on multiple pre-specified topics across a wide range of domains, with natural and fluent speech that aligns with real-world conversational scenarios. Additionally, 300 hours of this mobile-collected Korean natural conversational speech data has been manually transcribed into text with high accuracy.
提供机构:
maas
创建时间:
2022-12-29
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含500小时韩语自然对话手机采集语音,由约700名说话者面对面录制,内容覆盖多个话题,语音流畅自然,其中300小时已进行高精度人工转录。数据格式为16kHz、16位WAV单声道,主要用于测试韩语自然对话语音识别模型,版权归数据堂所有,可商业使用。
以上内容由遇见数据集搜集并总结生成



