asas-ai/DART
收藏Hugging Face2024-05-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/asas-ai/DART
下载链接
链接失效反馈官方服务:
资源简介:
DART数据集是一个用于文本分类任务的数据集,特别关注方言识别。数据集包含阿拉伯语的推文文本和对应的标签,分为训练集和测试集。训练集包含1323个样本,测试集包含500个样本。数据集的总大小为267723字节,下载大小为162379字节。
DART数据集是一个用于文本分类任务的数据集,特别关注方言识别。数据集包含阿拉伯语的推文文本和对应的标签,分为训练集和测试集。训练集包含1323个样本,测试集包含500个样本。数据集的总大小为267723字节,下载大小为162379字节。
提供机构:
asas-ai
原始信息汇总
数据集概述
基本信息
- 语言: 阿拉伯语 (ar)
- 大小类别: 1K<n<10K
- 任务类别: 文本分类
- 别名: DART
- 标签: 方言识别
数据集特征
- label: 数据类型为字符串
- tweet_text: 数据类型为字符串
数据分割
- 训练集:
- 示例数量: 1323
- 字节数: 198112
- 测试集:
- 示例数量: 500
- 字节数: 69611
数据集大小
- 下载大小: 162379字节
- 总大小: 267723字节
配置信息
- 默认配置:
- 训练数据路径: data/train-*
- 测试数据路径: data/test-*



