five

MightyStudent/Egyptian-ASR-MGB-3

收藏
Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MightyStudent/Egyptian-ASR-MGB-3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为埃及阿拉伯方言自动语音识别任务而收集、清理和调整的,适用于Whisper模型的微调/训练。数据集包含音频和句子两个主要特征,音频采样率为16000Hz,句子为埃及阿拉伯语的转录。数据集是从YouTube视频中收集的,每个视频的前12分钟被切割成30秒的片段。数据集支持自动语音识别任务,语言为埃及阿拉伯语。数据集的来源包括MGB挑战网站和YouTube。

该数据集是为埃及阿拉伯方言自动语音识别任务而收集、清理和调整的,适用于Whisper模型的微调/训练。数据集包含音频和句子两个主要特征,音频采样率为16000Hz,句子为埃及阿拉伯语的转录。数据集是从YouTube视频中收集的,每个视频的前12分钟被切割成30秒的片段。数据集支持自动语音识别任务,语言为埃及阿拉伯语。数据集的来源包括MGB挑战网站和YouTube。
提供机构:
MightyStudent
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Egyptian Arabic dialect automatic speech recognition
  • 数据集大小: 1K<n<10K
  • 任务类别: automatic-speech-recognition
  • 语言: Arabic - Egyptian dialect

数据字段

  • audio: 采样率为16000Hz,最大时长30秒。
  • sentence: 埃及阿拉伯语的转录文本。

数据集创建

  • 源数据: 来自YouTube的视频,部分视频已被删除或设为私有。
  • 数据处理: 从每个YouTube视频中截取前12分钟,切割成30秒的片段,上传至huggingface。

数据集用途

  • 主要用途: 用于whisper微调/训练,适用于自动语音识别模型。

数据集来源

  • 数据收集: 从YouTube收集约80个不同频道的节目,总计约16小时。
  • 转录过程: 每个节目由四名转录员根据转录指南进行手动转录。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作