Egyptian Arabic Segmentation Dataset
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Egyptian_Arabic_Segmentation_etc
下载链接
链接失效反馈官方服务:
资源简介:
包含 350 条推文,包含 8,000 多个单词,其中包括 3,000 个以埃及方言书写的独特单词。这些推文有很多方言内容,涵盖了埃及方言的大部分语音、形态和句法现象。它还包括文本的特定于 Twitter 的方面,例如#hashtags、@mentions、表情符号和 URL。
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含350条埃及阿拉伯语方言推文,涵盖8000多个单词,其中3000个为独特词汇,用于词性标注和形态分析。数据反映了方言的语音、形态和句法特征,并包含Twitter特有的元素如话题标签和表情符号。
以上内容由遇见数据集搜集并总结生成



