Dataset Package for Fusha–Darija Evaluation Tests (1–4): Materials, Model Responses, and Metrics
收藏NIAID Data Ecosystem2026-05-10 收录
下载链接:
https://doi.org/10.7910/DVN/W0C5DV
下载链接
链接失效反馈官方服务:
资源简介:
يوفر هذا الايداع حزمة بيانات مرافقة للدراسة، وتشمل مواد الاختبار الكاملة للاختبارات من 1 الى 4، واستجابات النماذج كاملة، ومؤشرات القياس المرتبطة بها. صممت مواد الاختبار لقياس الفروق بين العربية الفصحى والدارجة المغربية عبر ابعاد متعددة، وتشمل ازواجا نصية، وامثالا وتعابير، ومعجما مصغرا، ومجموعات تحويل لهجي، واسئلة موجهة لقياس الانحياز عبر مسارات تجريبية متوازية. كما تتضمن الحزمة ملفات توثيق منظمة تشرح بنية البيانات وحقولها، وملف قائمة محتويات، وملفات بصمات تحقق تتيح التاكد من سلامة البيانات بعد التحميل.
This deposit provides a dataset package accompanying the study and includes the complete testing materials for Tests 1–4, full model responses, and associated evaluation metrics. The testing materials were designed to assess differences between Standard Arabic and Moroccan Darija across multiple dimensions, and include paired textual samples, proverbs and expressions, a small lexicon, dialectal transformation sets, and bias-oriented prompts evaluated through parallel experimental paths. The package also includes structured documentation files describing the dataset organization and fields, a manifest of all files, and checksum files to enable verification of data integrity after download.
创建时间:
2026-01-05



