five

gfbati/Ten2Zero

收藏
Hugging Face2023-10-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gfbati/Ten2Zero
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-4.0 task_categories: - audio-classification - image-classification - tabular-classification language: - ar - en pretty_name: Arabic Spoken Digits from Ten to Zero size_categories: - 1K<n<10K tags: - orange data mining --- This dataset contains the following: 1- A balanced audio dataset of spoken Arabic digits from ten to zero in wav form (located at the "Dataset" folder); 2- A balanced image dataset of spoken Arabic digits from ten to zero in png form (located at the "Dataset" folder); 3- Tabular data generated using deep learning (SqueezeNet and Inception v3) from the spectrograms of the audio files; 4- Orange Data Mining workflows (".ows" files) used in processing this dataset. Please cite the following paper if this dataset is used in your publication: https://jesaun.journals.ekb.eg/article_322153.html يحوي مجلد مجموعة البيانات عشرة لصفر 4 مجلدات. المجلد الأول "Dataset" يحوي الملفات الصوتية بصيغة wav من عشرة لصفر، وكذلك الصور الطيفية (spectrograms)، كل رقم في مجلد خاص به. المجلد الثاني "Students" يحوي أسماء الطلبة المشاركين في جمع الملفات الصوتية ومعلومات تفصيلية عنهم وعن أجهزة التسجيل المستخدمة، كل طالب من الطلبة التسعة عشر في مجلد خاص به. المجلد الثالث "Testing" يحوي محاولات الطلبة غير المكتملة أو الذين قدموا ملفات أكثر من المطلوب، يمكن استخدام هذه الملفات في عمليات مختلفة من أبرزها -على سبيل المثال لا الحصر- اختبار نماذج الآلة المختلفة. المجلد الرابع "audio2spec-master" مأخوذ من الإنترنت ويحوي الكود البرمجي المكتوب بلغة بايثون والمعتمد على مكتبة librosa والذي يقوم بتحويل الملفات الصوتية بصيغة wav إلى صور طيفية (spectrograms). قامت الأداة بتحويل 85 ملفًا صوتيًا إلى صور طيفية بصيغة png من أصل 95 ملفًا صوتيًا لكل رقم من عشرة لصفر. هذا يعني أن عدد الملفات لكافة الأرقام العربية المنطوقة من عشرة لصفر = 85 صورة * 11 رقمًا = 935 صورة طيفية. كما يحوي المجلد الرئيس العديد من الملفات التي تم استخدامها لاستخراج خصائص الأرقام المنطوقة من مضمني الصور (Inception v3 and SqueezeNet)؛ للتصنيف، وكذلك ملفات برنامج أورانج لتنقيب البيانات (الإصدار 3.36) والتي تم استخدامها لبناء نماذج تعلم الآلة لتصنيف الأرقام العربية وتقييمها. المرجو كرمًا الاستشهاد بالبحث التالي عند استخدام مجموعة البيانات في أبحاثكم: https://jesaun.journals.ekb.eg/article_322153.html
提供机构:
gfbati
原始信息汇总

数据集概述

基本信息

  • 许可证: cc-by-4.0
  • 任务类别:
    • 音频分类
    • 图像分类
    • 表格分类
  • 语言:
    • 阿拉伯语
    • 英语
  • 数据集名称: Arabic Spoken Digits from Ten to Zero
  • 数据集大小: 1K<n<10K
  • 标签:
    • 橙色数据挖掘

数据内容

  1. 音频数据:

    • 格式: wav
    • 内容: 阿拉伯语发音的数字10至0
    • 位置: "Dataset" 文件夹
  2. 图像数据:

    • 格式: png
    • 内容: 阿拉伯语发音的数字10至0的图像
    • 位置: "Dataset" 文件夹
  3. 表格数据:

    • 生成方法: 使用深度学习模型(SqueezeNet 和 Inception v3)从音频文件的频谱图生成
    • 位置: 未明确指出
  4. Orange Data Mining 工作流程:

    • 文件格式: .ows
    • 用途: 处理此数据集
    • 位置: 未明确指出

引用信息

请在使用本数据集时引用上述文献。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作