five

Nexdata/249_Hours_Hangzhou_Dialect_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/249_Hours_Hangzhou_Dialect_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集收集了370位杭州方言使用者的口语录音,每位参与者录制了约500句话。录音在安静的室内环境中进行,使用Android和iPhone手机,录音内容为口语化、生活化的语言。转录内容包括文本和噪声符号,准确率为95%。数据集适用于语音识别和声纹识别。

该数据集收集了370位杭州方言使用者的口语录音,每位参与者录制了约500句话。录音在安静的室内环境中进行,使用Android和iPhone手机,录音内容为口语化、生活化的语言。转录内容包括文本和噪声符号,准确率为95%。数据集适用于语音识别和声纹识别。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据收集

  • 来源:370名杭州本地发言人
  • 内容:每人约500句杭州方言口语句子
  • 特点:录音内容贴近生活,自然流畅,由杭州本地人参与QA和校对,文本转录准确度高

技术规格

  • 格式:16kHz, 16bit, uncompressed wav, 单声道
  • 环境:安静的室内环境,无回声

参与者信息

  • 人数:370人
  • 性别分布:83%为女性

设备

  • 录音设备:主流Android手机和iPhone

语言

  • 方言:杭州方言

转录内容

  • 类型:文本及噪音符号
  • 准确率:95%(不包含噪音符号的准确率)

应用场景

  • 主要用途:语音识别、声纹识别

许可信息

  • 许可证:商业许可证
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作