arrmlet/reddit_dataset

Name: arrmlet/reddit_dataset
Creator: arrmlet
Published: 2024-07-12 01:42:11
License: 暂无描述

Hugging Face2024-07-12 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/arrmlet/reddit_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含五个特征：文本（text）、标签（label）、数据类型（dataType）、社区名称（communityName）和日期时间（datetime）。数据集分为一个训练集（train），包含476,463个样本，文件大小为131,316,743字节。下载大小为61,537,410字节。

The dataset contains five features: text, label, dataType, communityName, and datetime. The dataset is divided into one training set (train) with 476,463 samples, and the file size is 131,316,743 bytes. The download size is 61,537,410 bytes.

提供机构：

arrmlet

原始信息汇总

数据集概述

特征信息

text: 数据类型为字符串。
label: 数据类型为字符串。
dataType: 数据类型为字符串。
communityName: 数据类型为字符串。
datetime: 数据类型为字符串。

数据分割

train: 包含476463个样本，占用131316743字节。

数据集大小

下载大小: 61537410字节。
数据集大小: 131316743字节。

配置信息

default: 包含训练数据文件，路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集