Nexdata/249_Hours_Hangzhou_Dialect_Speech_Data_by_Mobile_Phone
收藏Hugging Face2024-04-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/249_Hours_Hangzhou_Dialect_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集收集了370位杭州方言使用者的口语录音,每位参与者录制了约500句话。录音在安静的室内环境中进行,使用Android和iPhone手机,录音内容为口语化、生活化的语言。转录内容包括文本和噪声符号,准确率为95%。数据集适用于语音识别和声纹识别。
该数据集收集了370位杭州方言使用者的口语录音,每位参与者录制了约500句话。录音在安静的室内环境中进行,使用Android和iPhone手机,录音内容为口语化、生活化的语言。转录内容包括文本和噪声符号,准确率为95%。数据集适用于语音识别和声纹识别。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据收集
- 来源:370名杭州本地发言人
- 内容:每人约500句杭州方言口语句子
- 特点:录音内容贴近生活,自然流畅,由杭州本地人参与QA和校对,文本转录准确度高
技术规格
- 格式:16kHz, 16bit, uncompressed wav, 单声道
- 环境:安静的室内环境,无回声
参与者信息
- 人数:370人
- 性别分布:83%为女性
设备
- 录音设备:主流Android手机和iPhone
语言
- 方言:杭州方言
转录内容
- 类型:文本及噪音符号
- 准确率:95%(不包含噪音符号的准确率)
应用场景
- 主要用途:语音识别、声纹识别
许可信息
- 许可证:商业许可证
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



