five

Nexdata/176_Hours_Suzhou_Dialect_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/176_Hours_Suzhou_Dialect_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集收集自250名说话者,每人约500句苏州方言的口语句子。苏州本地员工参与了录音,以确保口音的真实性。录音内容为口语化和生活化的语言,阅读更为自然流畅。苏州本地人参与了问答和校对,文本转换更为准确。使用主流的Android和Apple系统手机进行录制。数据格式为16kHz, 16bit, 未压缩的wav文件,单声道。录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景。

该数据集收集自250名说话者,每人约500句苏州方言的口语句子。苏州本地员工参与了录音,以确保口音的真实性。录音内容为口语化和生活化的语言,阅读更为自然流畅。苏州本地人参与了问答和校对,文本转换更为准确。使用主流的Android和Apple系统手机进行录制。数据格式为16kHz, 16bit, 未压缩的wav文件,单声道。录制环境为安静的室内环境,无回声。数据集适用于语音识别和声纹识别等应用场景。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据收集

  • 来源:250位苏州方言使用者
  • 内容:每人约500句口语句子
  • 质量保证:由苏州当地人员参与录音,确保口音纯正;当地人员参与QA和校对,文本转录准确

数据格式

  • 音频规格:16kHz, 16bit, 单声道,未压缩wav格式

录音环境

  • 环境:安静的室内环境,无回声

录音内容

  • 类型:口语

说话人信息

  • 人数:250人
  • 性别分布:52%为女性
  • 来源:苏州

录音设备

  • 设备:主流Android手机和iPhone

语言

  • 方言:苏州方言

转录内容

  • 内容:文本及噪音符号

准确率

  • 文本准确率:95%(噪音符号准确率未包含)

应用场景

  • 用途:语音识别,声纹识别

许可信息

  • 许可类型:商业许可
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作