Spam Email Classification垃圾邮件分类
收藏阿里云天池2026-06-03 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/92823
下载链接
链接失效反馈官方服务:
资源简介:
我们收集的非垃圾邮件来自归档的工作和个人电子邮件,因此,“乔治”一词和区域代码“ 650”表示非垃圾邮件。这些在构建个性化垃圾邮件过滤器时很有用。人们要么必须掩盖此类非垃圾邮件指标,要么必须收集大量非垃圾邮件来生成通用垃圾邮件过滤器。
The non-spam emails collected for this dataset are sourced from archived work and personal correspondence. Accordingly, the term "George" and the area code "650" serve as valid indicators of non-spam content. These indicators are highly valuable when constructing personalized spam filters. To develop a general-purpose spam filter, one must either conceal such non-spam indicators or collect a large volume of non-spam emails.
提供机构:
阿里云天池
创建时间:
2021-03-04
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于垃圾邮件分类的电子邮件数据库,包含垃圾邮件和非垃圾邮件的样本。数据集中提供了多种属性特征,如特定词频、字符频率以及大写字母序列的长度等,可用于构建个性化的垃圾邮件过滤器。
以上内容由遇见数据集搜集并总结生成



