Abdelkareem/arabic_tweets_classification
收藏Hugging Face2023-07-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Abdelkareem/arabic_tweets_classification
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Date
dtype: string
- name: Time
dtype: string
- name: Date Time
dtype: string
- name: URL
dtype: string
- name: Tweet Text
dtype: string
- name: Cleaned Text
dtype: string
- name: User Name
dtype: string
- name: Location
dtype: string
- name: 'Replied Tweet ID '
dtype: float64
- name: Replied Tweet User ID
dtype: float64
- name: Replied Tweet User name
dtype: string
- name: Coordinates
dtype: float64
- name: Retweet Count
dtype: float64
- name: Favorite Count
dtype: int64
- name: Favorited
dtype: string
- name: Label
dtype: string
splits:
- name: train
num_bytes: 7469621
num_examples: 13240
download_size: 3109198
dataset_size: 7469621
---
# Dataset Card for "arabic_tweets_classification"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Abdelkareem
原始信息汇总
数据集概述
数据集特征
- Date:数据类型为字符串。
- Time:数据类型为字符串。
- Date Time:数据类型为字符串。
- URL:数据类型为字符串。
- Tweet Text:数据类型为字符串。
- Cleaned Text:数据类型为字符串。
- User Name:数据类型为字符串。
- Location:数据类型为字符串。
- Replied Tweet ID:数据类型为浮点数。
- Replied Tweet User ID:数据类型为浮点数。
- Replied Tweet User name:数据类型为字符串。
- Coordinates:数据类型为浮点数。
- Retweet Count:数据类型为浮点数。
- Favorite Count:数据类型为整数。
- Favorited:数据类型为字符串。
- Label:数据类型为字符串。
数据集划分
- 训练集(train):
- 数据量:7469621字节
- 示例数量:13240个



