gfbati/Ten2Zero

Name: gfbati/Ten2Zero
Creator: gfbati
Published: 2023-10-20 10:57:01
License: 暂无描述

Hugging Face2023-10-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/gfbati/Ten2Zero

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: cc-by-4.0 task_categories: - audio-classification - image-classification - tabular-classification language: - ar - en pretty_name: Arabic Spoken Digits from Ten to Zero size_categories: - 1K<n<10K tags: - orange data mining --- This dataset contains the following: 1- A balanced audio dataset of spoken Arabic digits from ten to zero in wav form (located at the "Dataset" folder); 2- A balanced image dataset of spoken Arabic digits from ten to zero in png form (located at the "Dataset" folder); 3- Tabular data generated using deep learning (SqueezeNet and Inception v3) from the spectrograms of the audio files; 4- Orange Data Mining workflows (".ows" files) used in processing this dataset. Please cite the following paper if this dataset is used in your publication: https://jesaun.journals.ekb.eg/article_322153.html يحوي مجلد مجموعة البيانات عشرة لصفر 4 مجلدات. المجلد الأول "Dataset" يحوي الملفات الصوتية بصيغة wav من عشرة لصفر، وكذلك الصور الطيفية (spectrograms)، كل رقم في مجلد خاص به. المجلد الثاني "Students" يحوي أسماء الطلبة المشاركين في جمع الملفات الصوتية ومعلومات تفصيلية عنهم وعن أجهزة التسجيل المستخدمة، كل طالب من الطلبة التسعة عشر في مجلد خاص به. المجلد الثالث "Testing" يحوي محاولات الطلبة غير المكتملة أو الذين قدموا ملفات أكثر من المطلوب، يمكن استخدام هذه الملفات في عمليات مختلفة من أبرزها -على سبيل المثال لا الحصر- اختبار نماذج الآلة المختلفة. المجلد الرابع "audio2spec-master" مأخوذ من الإنترنت ويحوي الكود البرمجي المكتوب بلغة بايثون والمعتمد على مكتبة librosa والذي يقوم بتحويل الملفات الصوتية بصيغة wav إلى صور طيفية (spectrograms). قامت الأداة بتحويل 85 ملفًا صوتيًا إلى صور طيفية بصيغة png من أصل 95 ملفًا صوتيًا لكل رقم من عشرة لصفر. هذا يعني أن عدد الملفات لكافة الأرقام العربية المنطوقة من عشرة لصفر = 85 صورة * 11 رقمًا = 935 صورة طيفية. كما يحوي المجلد الرئيس العديد من الملفات التي تم استخدامها لاستخراج خصائص الأرقام المنطوقة من مضمني الصور (Inception v3 and SqueezeNet)؛ للتصنيف، وكذلك ملفات برنامج أورانج لتنقيب البيانات (الإصدار 3.36) والتي تم استخدامها لبناء نماذج تعلم الآلة لتصنيف الأرقام العربية وتقييمها. المرجو كرمًا الاستشهاد بالبحث التالي عند استخدام مجموعة البيانات في أبحاثكم: https://jesaun.journals.ekb.eg/article_322153.html

提供机构：

gfbati

原始信息汇总