five

Misraj/SadeedDiac-25

收藏
Hugging Face2025-05-20 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/Misraj/SadeedDiac-25
下载链接
链接失效反馈
官方服务:
资源简介:
SadeedDiac-25是一个为评估阿拉伯语标音模型而设计的全面且语言多样的基准数据集。它将现代标准阿拉伯语(MSA)和古典阿拉伯语(CA)统一在单个数据集中,解决了现有基准中的关键局限性。该数据集包含了来自不同领域的多样化内容,并通过多阶段专家评审过程确保了注释的高质量。

SadeedDiac-25 is a comprehensive and linguistically diverse benchmark specifically designed for evaluating Arabic diacritization models. It unifies Modern Standard Arabic (MSA) and Classical Arabic (CA) in a single dataset, addressing key limitations in existing benchmarks. The dataset includes diverse content from various domains and ensures high annotation quality through a multi-stage expert review process.
提供机构:
Misraj
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作