arbml/Arabic_Dialects_Dataset
收藏Hugging Face2024-07-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arbml/Arabic_Dialects_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本和标签两个特征,标签分为五个类别:Levant、North Africa、Egypt、GULF和MSA。数据集仅包含训练集,共有9992个样本,总大小为3451477字节。
This dataset is primarily used for text classification tasks, containing text data and corresponding regional labels. The text data is in string format, and the labels include five regional categories: Levant, North Africa, Egypt, GULF, and MSA. The dataset provides a training set with 9992 samples, with a total size of 3451477 bytes and a download size of 1789107 bytes.
提供机构:
arbml
原始信息汇总
数据集概述
数据特征
- Text: 文本数据,数据类型为字符串。
- label: 标签数据,数据类型为分类标签,包含以下类别:
- 0: Levant
- 1: North Africa
- 2: Egypt
- 3: GULF
- 4: MSA
数据集划分
- train: 训练集,包含9992个样本,占用3451477字节。
数据集大小
- 下载大小: 1789107字节
- 数据集大小: 3451477字节
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



