asas-ai/ArabGend
收藏Hugging Face2024-05-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asas-ai/ArabGend
下载链接
链接失效反馈官方服务:
资源简介:
ArabGend是一个用于分析和推断阿拉伯语Twitter用户性别的数据集,主要用于文本分类任务。数据集包含特征如性别和名字的首个单词,数据大小在10万到100万之间。
ArabGend是一个用于分析和推断阿拉伯语Twitter用户性别的数据集,主要用于文本分类任务。数据集包含特征如性别和名字的首个单词,数据大小在10万到100万之间。
提供机构:
asas-ai
原始信息汇总
数据集概述
基本信息
- 数据集名称: ArabGend
- 数据集大小: 2804876字节
- 下载大小: 793609字节
- 样本数量: 166533
- 语言: 阿拉伯语(ar)
- 任务类别: 文本分类
- 大小类别: 100K<n<1M
- 标签: Gender Identification
数据集结构
- 特征:
- gender: 数据类型为字符串
- name_first_word: 数据类型为字符串
数据集划分
- 训练集:
- 文件路径: data/train-*
- 字节数: 2804876
- 样本数: 166533
许可证
- 许可证类型: 未知



