Amazon-Fraud
收藏魔搭社区2025-12-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Amazon-Fraud
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Amazon-Fraud (Multi-relational Graph Dataset for Amazon Fraudulent Account
Detection)
license:
- Apache 2.0
mediaTypes:
- Graph
paperUrl: https://arxiv.org/pdf/2008.08692v1.pdf
publishDate: "2020"
publishUrl: https://github.com/YingtongDou/CARE-GNN
publisher:
- Beihang University
- University of Illinois at Chicago
tags:
- Detector
taskTypes:
- Node Classification
- Anomaly Detection
- Fraud Detection
- Graph Mining
---
# 数据集介绍
## 简介
Amazon-Fraud 是基于 Amazon 评论数据集构建的多关系图数据集,可用于评估基于图的节点分类、欺诈检测和异常检测模型。
数据集统计
# 节点
%欺诈节点(类别=1)
11,944
9.5
关系
# 边
U-P-U
175,608
U-S-U
3,566,479
U-V-U
1,036,737
全部
4,398,392
图构建
亚马逊数据集包括乐器类别下的产品评论。与本文类似,我们将有用投票超过 80% 的用户标记为良性实体,将有用投票少于 20% 的用户标记为欺诈实体。我们在 Amazon-Fraud 数据集上进行欺诈用户检测任务,这是一个二元分类任务。我们将本文中的 25 个手工特征作为 Amazon-Fraud 的原始节点特征。我们将用户作为图中的节点,设计了三种关系: 1)U-P-U:连接至少评论一个相同产品的用户; 2)U-S-V:连接一周内至少有一个相同星级的用户; 3)U-V-U:它连接所有用户中具有前 5% 的相互评论文本相似度(由 TF-IDF 衡量)的用户。
要下载数据集,请访问此 Github 存储库。如有其他问题,请发邮件至 ytongdou(AT)gmail.com 进行咨询。
## 引文
```
@inproceedings{dou2020enhancing,
title={Enhancing graph neural network-based fraud detectors against camouflaged fraudsters},
author={Dou, Yingtong and Liu, Zhiwei and Sun, Li and Deng, Yutong and Peng, Hao and Yu, Philip S},
booktitle={Proceedings of the 29th ACM International Conference on Information \& Knowledge Management},
pages={315--324},
year={2020}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:Amazon-Fraud(面向亚马逊欺诈账户检测的多关系图数据集(Multi-relational Graph Dataset for Amazon Fraudulent Account Detection))
许可协议:Apache 2.0
媒体类型:图(Graph)
论文链接:https://arxiv.org/pdf/2008.08692v1.pdf
发布日期:"2020"
发布仓库:https://github.com/YingtongDou/CARE-GNN
发布机构:北京航空航天大学(Beihang University)、伊利诺伊大学芝加哥分校(University of Illinois at Chicago)
标签:检测器(Detector)
任务类型:节点分类(Node Classification)、异常检测(Anomaly Detection)、欺诈检测(Fraud Detection)、图挖掘(Graph Mining)
---
# 数据集介绍
## 简介
Amazon-Fraud 是基于亚马逊评论数据集构建的多关系图数据集,可用于评估基于图的节点分类、欺诈检测与异常检测模型。
## 数据集统计
### 节点
欺诈节点(类别=1)共11,944个,占比9.5%。
### 边
U-P-U:175,608条
U-S-U:3,566,479条
U-V-U:1,036,737条
总计:4,398,392条
## 图构建
本数据集采用亚马逊乐器类别的产品评论数据。与该研究一致,我们将有用投票占比超过80%的用户标记为良性实体,将有用投票占比低于20%的用户标记为欺诈实体。本数据集聚焦欺诈用户检测任务,属于二元分类任务。我们采用该研究中的25个人工构造特征作为Amazon-Fraud的原始节点特征。我们以用户作为图中的节点,设计了三类关系:
1. U-P-U:连接至少评论过同一产品的用户;
2. U-S-V:连接一周内至少拥有一个相同评分星级的用户;
3. U-V-U:连接全体用户中相互评论文本相似度(由词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)衡量)位列前5%的用户。
如需下载数据集,请访问此GitHub仓库。如有其他疑问,请发送邮件至ytongdou(AT)gmail.com咨询。
## 引文
@inproceedings{dou2020enhancing,
title={面向伪装欺诈者的图神经网络欺诈检测器增强方法},
author={Dou, Yingtong and Liu, Zhiwei and Sun, Li and Deng, Yutong and Peng, Hao and Yu, Philip S},
booktitle={第29届ACM信息与知识管理国际会议论文集},
pages={315--324},
year={2020}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02



