five

Amazon-Fraud

收藏
魔搭社区2025-12-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Amazon-Fraud
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: Amazon-Fraud (Multi-relational Graph Dataset for Amazon Fraudulent Account Detection) license: - Apache 2.0 mediaTypes: - Graph paperUrl: https://arxiv.org/pdf/2008.08692v1.pdf publishDate: "2020" publishUrl: https://github.com/YingtongDou/CARE-GNN publisher: - Beihang University - University of Illinois at Chicago tags: - Detector taskTypes: - Node Classification - Anomaly Detection - Fraud Detection - Graph Mining --- # 数据集介绍 ## 简介 Amazon-Fraud 是基于 Amazon 评论数据集构建的多关系图数据集,可用于评估基于图的节点分类、欺诈检测和异常检测模型。 数据集统计 # 节点 %欺诈节点(类别=1) 11,944 9.5 关系 # 边 U-P-U 175,608 U-S-U 3,566,479 U-V-U 1,036,737 全部 4,398,392 图构建 亚马逊数据集包括乐器类别下的产品评论。与本文类似,我们将有用投票超过 80% 的用户标记为良性实体,将有用投票少于 20% 的用户标记为欺诈实体。我们在 Amazon-Fraud 数据集上进行欺诈用户检测任务,这是一个二元分类任务。我们将本文中的 25 个手工特征作为 Amazon-Fraud 的原始节点特征。我们将用户作为图中的节点,设计了三种关系: 1)U-P-U:连接至少评论一个相同产品的用户; 2)U-S-V:连接一周内至少有一个相同星级的用户; 3)U-V-U:它连接所有用户中具有前 5% 的相互评论文本相似度(由 TF-IDF 衡量)的用户。 要下载数据集,请访问此 Github 存储库。如有其他问题,请发邮件至 ytongdou(AT)gmail.com 进行咨询。 ## 引文 ``` @inproceedings{dou2020enhancing, title={Enhancing graph neural network-based fraud detectors against camouflaged fraudsters}, author={Dou, Yingtong and Liu, Zhiwei and Sun, Li and Deng, Yutong and Peng, Hao and Yu, Philip S}, booktitle={Proceedings of the 29th ACM International Conference on Information \& Knowledge Management}, pages={315--324}, year={2020} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:Amazon-Fraud(面向亚马逊欺诈账户检测的多关系图数据集(Multi-relational Graph Dataset for Amazon Fraudulent Account Detection)) 许可协议:Apache 2.0 媒体类型:图(Graph) 论文链接:https://arxiv.org/pdf/2008.08692v1.pdf 发布日期:"2020" 发布仓库:https://github.com/YingtongDou/CARE-GNN 发布机构:北京航空航天大学(Beihang University)、伊利诺伊大学芝加哥分校(University of Illinois at Chicago) 标签:检测器(Detector) 任务类型:节点分类(Node Classification)、异常检测(Anomaly Detection)、欺诈检测(Fraud Detection)、图挖掘(Graph Mining) --- # 数据集介绍 ## 简介 Amazon-Fraud 是基于亚马逊评论数据集构建的多关系图数据集,可用于评估基于图的节点分类、欺诈检测与异常检测模型。 ## 数据集统计 ### 节点 欺诈节点(类别=1)共11,944个,占比9.5%。 ### 边 U-P-U:175,608条 U-S-U:3,566,479条 U-V-U:1,036,737条 总计:4,398,392条 ## 图构建 本数据集采用亚马逊乐器类别的产品评论数据。与该研究一致,我们将有用投票占比超过80%的用户标记为良性实体,将有用投票占比低于20%的用户标记为欺诈实体。本数据集聚焦欺诈用户检测任务,属于二元分类任务。我们采用该研究中的25个人工构造特征作为Amazon-Fraud的原始节点特征。我们以用户作为图中的节点,设计了三类关系: 1. U-P-U:连接至少评论过同一产品的用户; 2. U-S-V:连接一周内至少拥有一个相同评分星级的用户; 3. U-V-U:连接全体用户中相互评论文本相似度(由词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)衡量)位列前5%的用户。 如需下载数据集,请访问此GitHub仓库。如有其他疑问,请发送邮件至ytongdou(AT)gmail.com咨询。 ## 引文 @inproceedings{dou2020enhancing, title={面向伪装欺诈者的图神经网络欺诈检测器增强方法}, author={Dou, Yingtong and Liu, Zhiwei and Sun, Li and Deng, Yutong and Peng, Hao and Yu, Philip S}, booktitle={第29届ACM信息与知识管理国际会议论文集}, pages={315--324}, year={2020} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作