Nexdata/997_Hours_Wuhan_Dialect_Speech_Data_by_Mobile_Phone

Name: Nexdata/997_Hours_Wuhan_Dialect_Speech_Data_by_Mobile_Phone
Creator: Nexdata
Published: 2024-04-16 05:51:05
License: 暂无描述

Hugging Face2024-04-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/997_Hours_Wuhan_Dialect_Speech_Data_by_Mobile_Phone

下载链接

链接失效反馈

官方服务：

资源简介：

武汉方言手机录音数据集包含997小时的音频数据，由超过2000名武汉方言母语者录制。录音文本涵盖通用、交互、车载、家庭等多个类别，内容丰富。武汉本地人参与了质量检查和校对，句子准确率达到95%。数据集适用于自动语音识别、机器翻译和声纹识别。录音格式为16kHz、16bit、未压缩的wav单声道文件，录音环境为安静的室内环境，无回声。录音内容包括通用类别、人机交互类别、智能家居命令和控制类别、数字和方言。参与录音的2291人中，55%为女性。转录内容包括文本、噪声符号和特殊标识符。录音设备包括安卓手机和iPhone。数据集的语言为武汉方言，准确率为95%（不包括噪声符号和其他标识符的准确率）。应用场景包括语音识别和声纹识别。

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集描述

内容：包含997小时的武汉方言音频数据，由超过2,000名武汉方言母语者使用移动电话录制。
覆盖类别：通用、交互、车载、家庭等多个类别，内容丰富。
质量控制：由武汉当地人参与质量检查和校对。
应用：适用于自动语音识别、机器翻译和声纹识别。

数据集格式

音频规格：16kHz采样率，16bit深度，单声道，未压缩wav格式。

录音环境

环境：安静的室内环境，无回声。

录音内容

类别：通用类别、人机交互类别、智能家居命令和控制类别、数字、方言。

人口统计

参与者：2,291人。
性别分布：55%为女性。

转录内容

内容：文本、噪声符号、特殊标识符。

设备

录音设备：Android手机、iPhone。

语言

方言：武汉方言。

准确率

整体准确率：95%（噪声符号和其他标识符的准确率未包含在内）。

应用场景

主要应用：语音识别、声纹识别。

许可信息

许可类型：商业许可。

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集