MightyStudent/Egyptian-ASR-MGB-3
收藏Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MightyStudent/Egyptian-ASR-MGB-3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为埃及阿拉伯方言自动语音识别任务而收集、清理和调整的,适用于Whisper模型的微调/训练。数据集包含音频和句子两个主要特征,音频采样率为16000Hz,句子为埃及阿拉伯语的转录。数据集是从YouTube视频中收集的,每个视频的前12分钟被切割成30秒的片段。数据集支持自动语音识别任务,语言为埃及阿拉伯语。数据集的来源包括MGB挑战网站和YouTube。
该数据集是为埃及阿拉伯方言自动语音识别任务而收集、清理和调整的,适用于Whisper模型的微调/训练。数据集包含音频和句子两个主要特征,音频采样率为16000Hz,句子为埃及阿拉伯语的转录。数据集是从YouTube视频中收集的,每个视频的前12分钟被切割成30秒的片段。数据集支持自动语音识别任务,语言为埃及阿拉伯语。数据集的来源包括MGB挑战网站和YouTube。
提供机构:
MightyStudent
原始信息汇总
数据集概述
基本信息
- 数据集名称: Egyptian Arabic dialect automatic speech recognition
- 数据集大小: 1K<n<10K
- 任务类别: automatic-speech-recognition
- 语言: Arabic - Egyptian dialect
数据字段
- audio: 采样率为16000Hz,最大时长30秒。
- sentence: 埃及阿拉伯语的转录文本。
数据集创建
- 源数据: 来自YouTube的视频,部分视频已被删除或设为私有。
- 数据处理: 从每个YouTube视频中截取前12分钟,切割成30秒的片段,上传至huggingface。
数据集用途
- 主要用途: 用于whisper微调/训练,适用于自动语音识别模型。
数据集来源
- 数据收集: 从YouTube收集约80个不同频道的节目,总计约16小时。
- 转录过程: 每个节目由四名转录员根据转录指南进行手动转录。



