Rasooli/tweets_dataset
收藏Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Rasooli/tweets_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含推文数据,每个样本具有唯一的id、标签(label)和推文内容(tweet)。数据集分为训练集和测试集,训练集包含5544个样本,测试集包含2376个样本。数据集的下载大小为766584字节,总大小为1185627.0字节。
This dataset contains tweet data, with each sample having a unique id, a label, and the content of the tweet. The dataset is divided into a training set and a test set, with the training set containing 5544 samples and the test set containing 2376 samples. The download size of the dataset is 766584 bytes, and the total size is 1185627.0 bytes.
提供机构:
Rasooli
原始信息汇总
数据集概述
基本信息
- 名称: tweets_dataset
- 描述: Rasooli/tweets_dataset 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
- 创建者: Abdul Qadeer Rasooli
- 关键词: 1K - 10K, parquet, Tabular, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- URL: Rasooli/tweets_dataset
数据格式
- 文件类型: Parquet 文件
- 编码格式: application/x-parquet
数据结构
- 子集: default
- 分割: train, test
- 字段:
- id: 整数类型,来自 HF Mirror parquet 文件的 id 列。
- label: 整数类型,来自 HF Mirror parquet 文件的 label 列。
- tweet: 文本类型,来自 HF Mirror parquet 文件的 tweet 列。
数据分布
- 文件集: parquet-files-for-config-default
- 描述: 由 HF Mirror 转换的底层 Parquet 文件。
- 包含: default//.parquet
数据集规范
- 符合标准: Croissant 1.0



