five

orkidea/wayuu_CO_test

收藏
Hugging Face2023-10-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/orkidea/wayuu_CO_test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个关于Wayuu语言的自动语音识别数据集,包含810个音频文件,每个音频文件都有对应的转录文本。音频总时长为2801秒(约34分钟),平均每个音频时长为3.41秒。数据集的词汇库包含大约1000个独特的单词。数据集来源于Wayuunaiki语言的圣经录音和转录,但由于版权限制,数据集不能公开分享。
提供机构:
orkidea
原始信息汇总

Wayuu 语言数据集

概述

  • 语言: guc
  • 许可: other
  • 大小类别: n<1K
  • 任务类别: automatic-speech-recognition
  • 美观名称: Wayuu language dataset

数据集信息

  • 特征:
    • 音频: 数据类型为 audio
    • 转录: 数据类型为 string
  • 分割:
    • 训练集:
      • 字节数: 123621131.0
      • 样本数: 810
  • 下载大小: 122728843
  • 数据集大小: 123621131.0
  • 配置:
    • 默认配置:
      • 数据文件:
        • 训练集: 路径为 data/train-*

音频时长

  • 总音频时长: 2801 秒 (约 34 分钟)
  • 平均音频时长: 3.41 秒

数据集内容

  • 数据集包含 810 个音频记录及其对应的转录文本。
  • 词汇库包含约 1,000 个独特单词。
  • 数据集源自 Wayuunaiki 语言的《圣经》录音和转录。
  • 由于版权限制,数据集不能公开分享,使用受“合理使用”原则保护。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作