five

1,722小时近场演讲语音数据_自发(中控设备)【数据堂】

收藏
OpenDataLab2024-05-28 更新2024-06-01 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1066
下载链接
链接失效反馈
官方服务:
资源简介:
采集真实演讲场景下通过AU中控台输出的语音数据1,722小时,演讲人发音自然,覆盖多种话题,基本不存在环境噪音

1,722 hours of speech data collected via AU central console in real speech scenarios, with natural pronunciations from speakers, covering diverse topics and featuring minimal ambient noise.
提供机构:
shujutang
创建时间:
2024-05-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含1,722小时在真实演讲场景下通过AU中控台采集的普通话语音,覆盖科技、培训、宣传等多种话题,格式为44.1kHz双声道wav文件。数据提供了文本、说话人身份和性别标注,句准确率不低于97%,适用于语音识别和声纹识别,但仅限企业合作购买使用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务