five

数据堂—338小时西班牙语手机采集语音数据

收藏
魔搭社区2024-10-16 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/338Hours-SpanishSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
338小时西班牙语手机采集语音数据,由800名西班牙、墨西哥、阿根廷等国的西班牙语母语人员参与录制;录音环境安静;所有文本由人工转写,句准确率95%。338小时西班牙语手机采集语音数据可应用于语音识别、机器翻译、声纹识别等

This 338-hour Spanish speech dataset was collected via mobile phones, recorded by 800 native Spanish speakers from countries including Spain, Mexico, Argentina and other regions. All recordings were made in quiet environments, and all transcriptions were manually completed with a sentence-level accuracy of 95%. This dataset can be applied to tasks such as speech recognition, machine translation and speaker recognition.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含338小时通过手机采集的西班牙语语音,由800名来自西班牙、墨西哥等国家的母语者录制,内容涵盖新闻、评论等多种类型。数据适用于西班牙语语音识别模型的评估任务,也可用于机器翻译和说话人验证等应用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务