阿拉伯语数据集
收藏OpenDataLab2026-06-07 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/ABear/ArabicNLP
下载链接
链接失效反馈官方服务:
资源简介:
阿拉伯语合并数据集是集合了多个阿拉伯语语料的数据总集。
The Arabic Merged Dataset is a comprehensive dataset assembled from multiple Arabic language corpora.
提供机构:
ABear
创建时间:
2023-07-20
搜集汇总
数据集介绍

背景与挑战
背景概述
阿拉伯语数据集是一个综合性的文本集合,包含9个子数据集,总大小54.3GB,适用于多种NLP任务。数据集涵盖了维基百科、新闻、社交媒体等多种文本类型,支持文本生成、情感分类等应用场景。
以上内容由遇见数据集搜集并总结生成



