Nexdata/Italian_Conversational_Speech_Data_by_Telephone
收藏Hugging Face2024-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Italian_Conversational_Speech_Data_by_Telephone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个意大利语对话语音数据集,包含了超过700名母语者的对话录音,总时长为500小时。录音设备为各种手机,音频格式为8kHz、8bit,并在安静的室内环境中录制。数据集还包括了手动转录的文本内容、每个有效句子的起止时间以及说话者识别信息。数据集的应用场景包括语音识别和声纹识别,单词准确率不低于98%。
This is an Italian conversational speech dataset comprising conversational audio recordings from over 700 native speakers, with a total duration of 500 hours. The recordings were collected using various mobile phones, with audio specifications set to 8kHz and 8bit, and all recordings were conducted in quiet indoor environments. The dataset additionally includes manually transcribed text, start and end timestamps for each valid sentence, as well as speaker identification information. Its application scenarios include speech recognition and speaker recognition, with a word accuracy rate of no less than 98%.
提供机构:
Nexdata
原始信息汇总
数据集卡片 Nexdata/Italian_Conversational_Speech_Data_by_Telephone
描述
500小时 - 意大利对话语音数据集涉及超过700名母语使用者,性别比例均衡。参与者从给定列表中选择几个熟悉的话题开始对话,确保对话的流畅性和自然性。录音设备为各种手机,音频格式为8kHz, 8bit,所有语音数据在安静的室内环境中录制。所有语音音频均手动转录为文本内容,包括每句有效句子的起始和结束时间以及说话人识别。
规格
格式
8kHz, 8bit, u-law pcm, 单声道;
录音环境
安静的室内环境,无回声;
录音内容
指定数十个话题,录音时参与者在这些话题下进行对话;
人口统计
约700人;
标注
转录文本、说话人识别和性别标注;
设备
电话录音系统;
语言
意大利语;
应用场景
语音识别;声纹识别;
准确率
单词准确率不低于98%。
许可信息
商业许可



