orkidea/wayuu_CO_test
收藏Hugging Face2023-10-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/orkidea/wayuu_CO_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个关于Wayuu语言的自动语音识别数据集,包含810个音频文件,每个音频文件都有对应的转录文本。音频总时长为2801秒(约34分钟),平均每个音频时长为3.41秒。数据集的词汇库包含大约1000个独特的单词。数据集来源于Wayuunaiki语言的圣经录音和转录,但由于版权限制,数据集不能公开分享。
提供机构:
orkidea
原始信息汇总
Wayuu 语言数据集
概述
- 语言: guc
- 许可: other
- 大小类别: n<1K
- 任务类别: automatic-speech-recognition
- 美观名称: Wayuu language dataset
数据集信息
- 特征:
- 音频: 数据类型为 audio
- 转录: 数据类型为 string
- 分割:
- 训练集:
- 字节数: 123621131.0
- 样本数: 810
- 训练集:
- 下载大小: 122728843
- 数据集大小: 123621131.0
- 配置:
- 默认配置:
- 数据文件:
- 训练集: 路径为 data/train-*
- 数据文件:
- 默认配置:
音频时长
- 总音频时长: 2801 秒 (约 34 分钟)
- 平均音频时长: 3.41 秒
数据集内容
- 数据集包含 810 个音频记录及其对应的转录文本。
- 词汇库包含约 1,000 个独特单词。
- 数据集源自 Wayuunaiki 语言的《圣经》录音和转录。
- 由于版权限制,数据集不能公开分享,使用受“合理使用”原则保护。



