数据堂—1,722小时近场演讲语音数据_自发（中控设备）

Name: 数据堂—1,722小时近场演讲语音数据_自发（中控设备）
Creator: maas
Published: 2025-12-04 10:37:16
License: 暂无描述

魔搭社区2025-12-04 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/DatatangBeijing/1722Hours-Near-fieldConferenceSpeechData

下载链接

链接失效反馈

官方服务：

资源简介：

采集真实演讲场景下通过AU中控台输出的语音数据1,722小时，演讲人发音自然，覆盖多种话题，基本不存在环境噪音

This dataset includes 1,722 hours of speech data output via the AU central console in real-world speech scenarios, with natural speaker pronunciations, covering diverse topics and featuring negligible ambient noise.

提供机构：

maas

创建时间：

2024-05-07

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集包含1,722小时来自AU中控系统的近场演讲语音数据，录制于真实场景，语音为普通话，覆盖科技、培训等多种话题，环境噪声极少。数据格式为44.1kHz、16bit的wav立体声，标注包括文本、说话人身份和性别，适用于语音识别和声纹识别任务，句子准确率不低于97%。

以上内容由遇见数据集搜集并总结生成