five

SMS Spam Collection Data Set

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SMS_Spam_Collection_Data_Set
下载链接
链接失效反馈
官方服务:
资源简介:
该语料库是从互联网上免费或免费的研究来源收集的: 从 Grumbletext 网站手动提取了 425 条 SMS 垃圾邮件集合。这是一个英国论坛,手机用户在该论坛上公开声明垃圾短信,其中大多数人没有报告收到的垃圾短信。识别索赔中的垃圾邮件文本是一项非常艰巨且耗时的任务,它涉及仔细扫描数百个网页。 新加坡国立大学短信语料库 (NSC) 中随机选择的 3,375 条短信的子集,这是新加坡国立大学计算机科学系为研究收集的大约 10,000 条合法短信的数据集。这些信息主要来自新加坡人,主要来自就读大学的学生。这些信息是从志愿者那里收集的,他们知道他们的贡献将被公开。 从 Caroline Tag 的博士论文中收集的 450 条 SMS 火腿消息的列表。 SMS Spam Corpus v.0.1 Big。它有 1,002 条 SMS 火腿消息和 322 条垃圾消息。
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作