five

RetaSy/quranic_audio_dataset

收藏
Hugging Face2024-05-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/RetaSy/quranic_audio_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
我们探索了众包一个精心标注的古兰经数据集的可能性,在此基础上可以构建AI模型以简化学习过程。特别是,我们使用基于志愿者的众包类型,并实现了一个众包API来收集音频资源。我们开发了一个名为Quran Voice的众包平台来标注收集的音频资源。结果,我们从11个以上非阿拉伯国家的1287名参与者中收集了约7000个古兰经诵读音频,并从数据集中标注了1166个诵读音频,分为六个类别。我们达到了0.77的众包准确率,标注者之间的评分一致性为0.63,算法分配的标签与专家判断之间的一致性为0.89。
提供机构:
RetaSy
原始信息汇总

数据集概述

数据集名称

  • 名称: Quranic Audio Dataset - Crowdsourced and Labeled Recitation from Non-Arabic Speakers

数据集特征

  • audio (dict): 包含音频文件路径、解码后的音频数组和采样率。
  • Surah (string): 古兰经的章节。
  • Aya (string): 古兰经章节中的特定诗句。
  • duration_ms (int64): 音频记录的持续时间,以毫秒为单位。
  • create_date (string): 音频记录的创建日期和时间。
  • golden (bool): 音频样本是否由专家标记。
  • final_label (string): 音频样本的共识标签,指示朗诵的分类。
  • reciter_id (string): 朗诵者的唯一标识符。
  • reciter_country (string): 朗诵者的国家。
  • reciter_gender (string): 朗诵者的性别。
  • reciter_age (string): 朗诵者的年龄。
  • reciter_qiraah (string): 朗诵者使用的朗诵风格。
  • judgments_num (int64): 每个音频样本的评判或注释数量。
  • annotation_metadata (string): 与每个音频样本的注释相关的元数据。

数据集结构

  • 训练集 (train): 包含6828个样本,总大小为1290351809.656字节。

任务类别

  • automatic-speech-recognition
  • audio-classification

语言

  • ar (阿拉伯语)

标签

  • Crowdsourcing
  • Quranic recitation
  • Non-Arabic Speakers

引用信息

@inproceedings{quran_audio_dataset:2024, author = {Raghad Salameh, Mohamad Al Mdfaa, Nursultan Askarbekuly, Manuel Mazzara}, title = {Quranic Audio Dataset: Crowdsourced and Labeled Recitation from Non-Arabic Speakers}, year = 2024, eprint = {2405.02675}, eprinttype = {arxiv}, eprintclass = {cs.SD}, url = {https://arxiv.org/abs/2405.02675}, language = {english} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作