Nexdata/Spanish_Speech_Data_by_Mobile_Phone_Reading

Name: Nexdata/Spanish_Speech_Data_by_Mobile_Phone_Reading
Creator: Nexdata
Published: 2024-04-17 01:41:37
License: 暂无描述

Hugging Face2024-04-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/Spanish_Speech_Data_by_Mobile_Phone_Reading

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集的容量为227小时，由来自西班牙、墨西哥和委内瑞拉的西班牙语母语者在安静环境中录制。录制内容涵盖经济、娱乐、新闻和口语等多个领域。所有文本均经过手动转录，句子准确率为95%。该数据集可用于自动语音识别（ASR）和音频说话人识别任务的模型训练。

提供机构：

Nexdata

原始信息汇总

数据集概述

数据集名称

名称: Nexdata/Spanish Speech_Data_by_Mobile_Phone

数据集描述

数据集摘要

数据量: 227小时
录制者: 西班牙、墨西哥和委内瑞拉的西班牙语母语者
录制环境: 安静环境
内容范围: 经济、娱乐、新闻和口语
文本转录: 手动转录，准确率95%

支持的任务和排行榜

任务: 自动语音识别（ASR）、音频说话人识别

语言

语言: 西班牙语

数据集结构

数据实例

信息: 待补充

数据字段

信息: 待补充

数据分割

信息: 待补充

数据集创建

采集理由

信息: 待补充

源数据

初始数据收集和标准化: 待补充
源语言生产者: 待补充

标注

标注过程: 待补充
标注者: 待补充

个人和敏感信息

信息: 待补充

使用数据的考虑

数据集的社会影响

信息: 待补充

偏见讨论

信息: 待补充

其他已知限制

信息: 待补充

附加信息

数据集管理者

信息: 待补充

许可信息

许可类型: 商业许可
许可链接: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing

引用信息

信息: 待补充

贡献

信息: 待补充

5,000+

优质数据集

54 个

任务类型

进入经典数据集