Amazon-Fraud

Name: Amazon-Fraud
Creator: maas
Published: 2025-12-19 17:45:14
License: 暂无描述

魔搭社区2025-12-19 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/OmniData/Amazon-Fraud

下载链接

链接失效反馈

官方服务：

资源简介：

displayName: Amazon-Fraud (Multi-relational Graph Dataset for Amazon Fraudulent Account Detection) license: - Apache 2.0 mediaTypes: - Graph paperUrl: https://arxiv.org/pdf/2008.08692v1.pdf publishDate: "2020" publishUrl: https://github.com/YingtongDou/CARE-GNN publisher: - Beihang University - University of Illinois at Chicago tags: - Detector taskTypes: - Node Classification - Anomaly Detection - Fraud Detection - Graph Mining --- # 数据集介绍 ## 简介 Amazon-Fraud 是基于 Amazon 评论数据集构建的多关系图数据集，可用于评估基于图的节点分类、欺诈检测和异常检测模型。数据集统计 # 节点 %欺诈节点（类别=1） 11,944 9.5 关系 # 边 U-P-U 175,608 U-S-U 3,566,479 U-V-U 1,036,737 全部 4,398,392 图构建亚马逊数据集包括乐器类别下的产品评论。与本文类似，我们将有用投票超过 80% 的用户标记为良性实体，将有用投票少于 20% 的用户标记为欺诈实体。我们在 Amazon-Fraud 数据集上进行欺诈用户检测任务，这是一个二元分类任务。我们将本文中的 25 个手工特征作为 Amazon-Fraud 的原始节点特征。我们将用户作为图中的节点，设计了三种关系： 1）U-P-U：连接至少评论一个相同产品的用户； 2）U-S-V：连接一周内至少有一个相同星级的用户； 3）U-V-U：它连接所有用户中具有前 5% 的相互评论文本相似度（由 TF-IDF 衡量）的用户。要下载数据集，请访问此 Github 存储库。如有其他问题，请发邮件至 ytongdou(AT)gmail.com 进行咨询。 ## 引文 ``` @inproceedings{dou2020enhancing, title={Enhancing graph neural network-based fraud detectors against camouflaged fraudsters}, author={Dou, Yingtong and Liu, Zhiwei and Sun, Li and Deng, Yutong and Peng, Hao and Yu, Philip S}, booktitle={Proceedings of the 29th ACM International Conference on Information \& Knowledge Management}, pages={315--324}, year={2020} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称：Amazon-Fraud（面向亚马逊欺诈账户检测的多关系图数据集（Multi-relational Graph Dataset for Amazon Fraudulent Account Detection））许可协议：Apache 2.0 媒体类型：图（Graph）论文链接：https://arxiv.org/pdf/2008.08692v1.pdf 发布日期："2020" 发布仓库：https://github.com/YingtongDou/CARE-GNN 发布机构：北京航空航天大学（Beihang University）、伊利诺伊大学芝加哥分校（University of Illinois at Chicago）标签：检测器（Detector）任务类型：节点分类（Node Classification）、异常检测（Anomaly Detection）、欺诈检测（Fraud Detection）、图挖掘（Graph Mining） --- # 数据集介绍 ## 简介 Amazon-Fraud 是基于亚马逊评论数据集构建的多关系图数据集，可用于评估基于图的节点分类、欺诈检测与异常检测模型。 ## 数据集统计 ### 节点欺诈节点（类别=1）共11,944个，占比9.5%。 ### 边 U-P-U：175,608条 U-S-U：3,566,479条 U-V-U：1,036,737条总计：4,398,392条 ## 图构建本数据集采用亚马逊乐器类别的产品评论数据。与该研究一致，我们将有用投票占比超过80%的用户标记为良性实体，将有用投票占比低于20%的用户标记为欺诈实体。本数据集聚焦欺诈用户检测任务，属于二元分类任务。我们采用该研究中的25个人工构造特征作为Amazon-Fraud的原始节点特征。我们以用户作为图中的节点，设计了三类关系： 1. U-P-U：连接至少评论过同一产品的用户； 2. U-S-V：连接一周内至少拥有一个相同评分星级的用户； 3. U-V-U：连接全体用户中相互评论文本相似度（由词频-逆文档频率（Term Frequency-Inverse Document Frequency, TF-IDF）衡量）位列前5%的用户。如需下载数据集，请访问此GitHub仓库。如有其他疑问，请发送邮件至ytongdou(AT)gmail.com咨询。 ## 引文 @inproceedings{dou2020enhancing, title={面向伪装欺诈者的图神经网络欺诈检测器增强方法}, author={Dou, Yingtong and Liu, Zhiwei and Sun, Li and Deng, Yutong and Peng, Hao and Yu, Philip S}, booktitle={第29届ACM信息与知识管理国际会议论文集}, pages={315--324}, year={2020} } ## 数据集下载 :modelscope-code[]{type="git"}

提供机构：

maas

创建时间：

2024-07-02

5,000+

优质数据集

54 个

任务类型

进入经典数据集