ilhamxx/enron
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ilhamxx/enron
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含155,221个样本,每个样本包含五个特征字段:file、Date、Sender、Receiver和MESSAGE,数据类型均为字符串。数据集分为一个名为train的分割,总大小为245,650,477.7097319字节,下载大小为122,301,186字节。默认配置的数据文件路径为data/train-*。
The dataset contains 155,221 samples, each with five feature fields: file, Date, Sender, Receiver, and MESSAGE, all of which are of string type. The dataset is divided into a single split named train, with a total size of 245,650,477.7097319 bytes and a download size of 122,301,186 bytes. The default configuration specifies the data file path as data/train-*.
提供机构:
ilhamxx
原始信息汇总
数据集概述
数据集信息
- 特征字段:
file: 文件名,数据类型为字符串。Date: 日期,数据类型为字符串。Sender: 发送者,数据类型为字符串。Receiver: 接收者,数据类型为字符串。MESSAGE: 消息内容,数据类型为字符串。
数据分割
- 训练集:
- 名称:
train - 字节数: 245,650,477.7097319
- 样本数: 155,221
- 名称:
数据集大小
- 下载大小: 122,301,186 字节
- 数据集总大小: 245,650,477.7097319 字节
配置
- 默认配置:
- 名称:
default - 数据文件路径:
data/train-*
- 名称:



