Nexdata/Spanish_Conversational_Speech_Data_by_Telephone
收藏Hugging Face2024-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Spanish_Conversational_Speech_Data_by_Telephone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个西班牙语对话语音数据集,包含了超过700名母语者的对话录音,总计500小时。录音设备为各种手机,音频格式为8kHz、8bit,所有录音均在安静的室内环境中进行。数据集还包括了语音的手动转录文本、每个有效句子的开始和结束时间以及说话者识别信息。此外,数据集的应用场景包括语音识别和声纹识别,单词准确率不低于98%。
This is a Spanish conversational speech dataset containing recorded conversations from over 700 native speakers, with a total duration of 500 hours. All recordings were collected using various mobile phones, with audio specifications of 8kHz sampling rate and 8-bit bit depth, and were conducted in quiet indoor environments. The dataset also includes manual speech transcriptions, the start and end timestamps of each valid utterance, as well as speaker identification information. In addition, the application scenarios of this dataset cover speech recognition and speaker verification, with a word accuracy rate of no less than 98%.
提供机构:
Nexdata
原始信息汇总
数据集卡片 Nexdata/Spanish_Conversational_Speech_Data_by_Telephone
描述
500小时 - 西班牙语会话语音数据集涉及超过700名母语使用者,性别比例平衡。参与者从给定列表中选择熟悉的话题进行对话,确保对话的流畅性和自然性。录音设备为各种手机,音频格式为8kHz、8bit,所有语音数据在安静的室内环境中录制。所有语音音频均经过手动转录,包括文本内容、每句有效句子的起止时间以及说话人识别。
规范
格式
8kHz, 8bit, u-law pcm, 单声道;
录音环境
安静的室内环境,无回声;
录音内容
指定数十个话题,录音时参与者在这些话题下进行对话;
人口统计
约700人;
标注
转录文本、说话人识别和性别标注;
设备
电话录音系统;
语言
西班牙语;
应用场景
语音识别;声纹识别;
准确率
单词准确率不低于98%
许可信息
商业许可



