数据堂—1,722小时近场演讲语音数据_自发(中控设备)
收藏魔搭社区2025-12-04 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/1722Hours-Near-fieldConferenceSpeechData
下载链接
链接失效反馈官方服务:
资源简介:
采集真实演讲场景下通过AU中控台输出的语音数据1,722小时,演讲人发音自然,覆盖多种话题,基本不存在环境噪音
This dataset includes 1,722 hours of speech data output via the AU central console in real-world speech scenarios, with natural speaker pronunciations, covering diverse topics and featuring negligible ambient noise.
提供机构:
maas
创建时间:
2024-05-07
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含1,722小时来自AU中控系统的近场演讲语音数据,录制于真实场景,语音为普通话,覆盖科技、培训等多种话题,环境噪声极少。数据格式为44.1kHz、16bit的wav立体声,标注包括文本、说话人身份和性别,适用于语音识别和声纹识别任务,句子准确率不低于97%。
以上内容由遇见数据集搜集并总结生成



