five

垃圾邮件数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-11897.html
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集是从[ here ][1]收集的。我刚用了 Enron1文件夹。它包含两个文件夹的垃圾邮件和火腿。每个文件夹都包含电子邮件。我对这些文件夹的每个文本文件进行迭代,创建一个数据框并写入一个 csv 文件。这对其他人也有帮助。Http://www2.aueb.gr/users/ion/data/enron-spam/

This dataset was collected from [here][1]. I utilized the Enron1 folder, which contains two subfolders for spam and ham emails respectively. Each subfolder holds individual email messages. I iterated over every text file within these subfolders, constructed a data frame, and exported the dataset to a CSV file. This resource will be helpful for other researchers. The original source URL is: http://www2.aueb.gr/users/ion/data/enron-spam/
提供机构:
帕依提提
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该垃圾邮件数据集包含来自Enron1文件夹的垃圾邮件和正常邮件(火腿),用于电子邮件和消息分类任务,属于自然语言处理领域。数据集大小为5.25M,包含两个子文件夹,分别存储不同类型的邮件。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务