five

Nexdata/67_Hours_Northeast_Dialect_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/67_Hours_Northeast_Dialect_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集收集了来自中国东北地区的312位说话者,所有说话者均使用东北方言朗读文本。录音内容涵盖近30个领域的客户咨询和短信文本。句子由专业标注员手动转录和校对,具有高准确性。录音在安静的室内环境中进行,使用Android手机录制,格式为16kHz、16bit、未压缩的wav单声道文件。数据集适用于语音识别和声纹识别等应用场景。

该数据集收集了来自中国东北地区的312位说话者,所有说话者均使用东北方言朗读文本。录音内容涵盖近30个领域的客户咨询和短信文本。句子由专业标注员手动转录和校对,具有高准确性。录音在安静的室内环境中进行,使用Android手机录制,格式为16kHz、16bit、未压缩的wav单声道文件。数据集适用于语音识别和声纹识别等应用场景。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集描述

  • 来源地区:中国东北地区
  • 发言人数量:312人
  • 发言人特征:70%为女性
  • 语言:东北方言
  • 录音内容:涵盖近30个领域的客户咨询和文本消息
  • 文本转录:由专业标注员手动转录和校对,准确率达95%

数据集格式

  • 音频格式:16kHz, 16bit, 单声道,未压缩的wav格式

录音环境

  • 环境:安静的室内环境,无回声

录音设备

  • 设备:Android手机

应用场景

  • 应用:语音识别,声纹识别

许可信息

  • 许可类型:商业许可
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作