safaalh/mails_enron
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/safaalh/mails_enron
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含103480个样本,每个样本包含文件、日期、发送者、接收者、消息和嵌入向量等特征。数据集总大小为77207656978字节,下载大小为4493597037字节。数据集仅包含一个训练分割。
This dataset contains 103480 samples, each with features such as file, date, sender, receiver, message, and embeddings. The total size of the dataset is 77207656978 bytes, with a download size of 4493597037 bytes. The dataset includes only a training split.
提供机构:
safaalh
原始信息汇总
数据集概述
数据集信息
- 特征:
- file: 数据类型为
string - Date: 数据类型为
string - Sender: 数据类型为
string - Receiver: 数据类型为
string - MESSAGE: 数据类型为
string - embeddings: 数据类型为
float32的序列
- file: 数据类型为
数据集分割
- train:
- 文件大小: 77,207,656,978 字节
- 样本数量: 103,480 个
数据集大小
- 下载大小: 4,493,597,037 字节
- 总大小: 77,207,656,978 字节
配置
- default:
- 数据文件:
- train:
data/train-*
- train:
- 数据文件:



