five

数据堂—435小时西班牙语手机采集语音数据

收藏
魔搭社区2024-10-16 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/435Hours-SpanishSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
435小时西班牙语手机采集语音数据总计435小时,由989名西班牙本土发音人参与录制;录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别,内容丰富;435小时西班牙语手机采集语音数据的文本经过人工校对,准确率高。匹配主流安卓、苹果系统手机

This dataset contains 435 hours of Spanish speech data collected via mobile phones, recorded by 989 native Spanish speakers. The recording scripts were developed by linguistic experts, covering multiple categories such as general scenarios, interactive scenarios, in-vehicle scenarios and smart home scenarios, with rich and varied content. The transcripts of this 435-hour mobile-collected Spanish speech data have been manually proofread, achieving high accuracy. It is compatible with mainstream Android and iOS mobile devices.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含435小时的西班牙语手机采集语音,由989名母语者录制,内容涵盖对话、交互、命令等多种场景,专用于西班牙语语音识别模型的评估任务。数据格式为16kHz单声道WAV,录制环境安静无回声,且所有文本经过人工校对以确保准确性。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务