five

Social-Spammer

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Social-Spammer
下载链接
链接失效反馈
官方服务:
资源简介:
社交垃圾邮件发送者异构数据集是从一个名为Tagged的社交软件中收集的,该软件包含560万用户和8500万用户之间的联系。数据集中的每个用户都包含四个功能和一个手动输入的标签分类,以识别其是否为垃圾邮件帐户。数据集中的每个链接表示两个用户之间的交互,并包含时间戳和类别。网络中用户之间的连接有七个匿名类别。该数据集最原始的任务是根据关联和非关联特征识别垃圾邮件帐户。

The Heterogeneous Social Spammer Dataset is collected from a social platform named Tagged, which has 5.6 million registered users and 85 million user-to-user connections. Each user in the dataset is associated with four features and a manually annotated label used to classify whether the user is a spam account. Each link in the dataset represents an interaction between two users, and contains a timestamp and a category. The connections between users in the network fall into seven anonymous categories. The original core task of this dataset is to identify spam accounts using both relational and non-relational features.
提供机构:
OpenDataLab
创建时间:
2023-04-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Social-Spammer数据集是从Tagged社交软件收集的异构数据,包含560万用户和8500万用户之间的连接,每个用户具有四个特征和手动分类标签,用于识别垃圾邮件账户。数据集还包括用户交互的时间戳和七个匿名类别,核心任务是根据关联和非关联特征检测垃圾邮件账户。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作