Nexdata/176_Hours_Suzhou_Dialect_Speech_Data_by_Mobile_Phone|方言语音数据数据集|语音识别数据集
收藏hugging_face2024-04-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/176_Hours_Suzhou_Dialect_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈资源简介:
该数据集收集自250名说话者,每人约500句苏州方言的口语句子。苏州本地员工参与了录音,以确保口音的真实性。录音内容为口语化和生活化的语言,阅读更为自然流畅。苏州本地人参与了问答和校对,文本转换更为准确。使用主流的Android和Apple系统手机进行录制。数据格式为16kHz, 16bit, 未压缩的wav文件,单声道。录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景。
该数据集收集自250名说话者,每人约500句苏州方言的口语句子。苏州本地员工参与了录音,以确保口音的真实性。录音内容为口语化和生活化的语言,阅读更为自然流畅。苏州本地人参与了问答和校对,文本转换更为准确。使用主流的Android和Apple系统手机进行录制。数据格式为16kHz, 16bit, 未压缩的wav文件,单声道。录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据收集
- 来源:250位苏州方言使用者
- 内容:每人约500句口语句子
- 质量保证:由苏州当地人员参与录音,确保口音纯正;当地人员参与QA和校对,文本转录准确
数据格式
- 音频规格:16kHz, 16bit, 单声道,未压缩wav格式
录音环境
- 环境:安静的室内环境,无回声
录音内容
- 类型:口语
说话人信息
- 人数:250人
- 性别分布:52%为女性
- 来源:苏州
录音设备
- 设备:主流Android手机和iPhone
语言
- 方言:苏州方言
转录内容
- 内容:文本及噪音符号
准确率
- 文本准确率:95%(噪音符号准确率未包含)
应用场景
- 用途:语音识别,声纹识别
许可信息
- 许可类型:商业许可
