Amazon-Fraud (Multi-relational Graph Dataset for Amazon Fraudulent Account Detection)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Amazon-Fraud
下载链接
链接失效反馈官方服务:
资源简介:
Amazon-Fraud 是基于 Amazon 评论数据集构建的多关系图数据集,可用于评估基于图的节点分类、欺诈检测和异常检测模型。
数据集统计
# 节点
%欺诈节点(类别=1)
11,944
9.5
关系
# 边
U-P-U
175,608
U-S-U
3,566,479
U-V-U
1,036,737
全部
4,398,392
图构建
亚马逊数据集包括乐器类别下的产品评论。与本文类似,我们将有用投票超过 80% 的用户标记为良性实体,将有用投票少于 20% 的用户标记为欺诈实体。我们在 Amazon-Fraud 数据集上进行欺诈用户检测任务,这是一个二元分类任务。我们将本文中的 25 个手工特征作为 Amazon-Fraud 的原始节点特征。我们将用户作为图中的节点,设计了三种关系: 1)U-P-U:连接至少评论一个相同产品的用户; 2)U-S-V:连接一周内至少有一个相同星级的用户; 3)U-V-U:它连接所有用户中具有前 5% 的相互评论文本相似度(由 TF-IDF 衡量)的用户。
要下载数据集,请访问此 Github 存储库。如有其他问题,请发邮件至 ytongdou(AT)gmail.com 进行咨询。
提供机构:
OpenDataLab
创建时间:
2022-06-23



