five

azzedine/Goud-sum_v2

收藏
Hugging Face2025-02-06 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/azzedine/Goud-sum_v2
下载链接
链接失效反馈
官方服务:
资源简介:
GOOD-Sum_v2是一个扩展版本的数据集,基于原始的GOOD-Sum数据集构建,总共包含了189,000篇用于训练的文章,9,497篇用于验证的文章,以及9,497篇用于测试的文章。该数据集中的文章使用摩洛哥达尔杰语、现代标准阿拉伯语或两者的混合体撰写。这些文章是从GOUD.ma网站抓取的,展现了摩洛哥媒体的语文多样性。

GOOD-Sum_v2 is an expanded version of the original GOOD-Sum dataset, containing a total of 189,000 articles for training, 9,497 articles for validation, and 9,497 articles for testing. The articles in the dataset are written in Moroccan Darija, Modern Standard Arabic (MSA), or a mix of both. The dataset was scraped from the GOUD.ma website, showcasing the linguistic diversity of Moroccan media.
提供机构:
azzedine
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作