five

DGraph

收藏
github2024-09-17 更新2024-09-20 收录
下载链接:
https://github.com/ZhouShichan/Financial-anomaly-detection
下载链接
链接失效反馈
官方服务:
资源简介:
DGraph是一个大规模动态图数据集的集合,由真实金融场景中随着时间演变的事件和标签构成。

DGraph is a collection of large-scale dynamic graph datasets composed of time-evolving events and labels from real-world financial scenarios.
创建时间:
2024-09-16
原始信息汇总

金融异常检测任务

数据集

  • 数据集名称: DGraph
  • 数据集来源: DGraph
  • 数据集描述: 大规模动态图数据集的集合,由真实金融场景中随着时间演变的事件和标签构成。

实验目的

  • 了解如何使用 Pytorch 进行神经网络训练
  • 了解如何使用 Pytorch-geometric 等图网络深度学习库进行简单图神经网络设计(推荐使用 GAT, GraphSAGE 模型)。
  • 了解如何利用 MO 平台进行模型性能评估。

预备知识

实验环境

  • python = 3.9.5
  • numpy = 1.26.4
  • pandas =
  • pytorch = 2.3.1
  • torch_geometric = 2.5.3
  • torch_scatter = 2.1.2
  • torch_sparse = 0.6.18

实验环境准备

  1. 安装 Miniconda 或 Anaconda,请参考官方文档:https://www.anaconda.com/

  2. 创建 conda 环境 shell conda create -n mo_graph python=3.9.5 conda activate mo_graph

  3. 安装 Pytorch 环境,请参考官方文档:https://pytorch.org/get-started/previous-versions/ shell conda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==0.13.1 pytorch-cuda=11.8 -c pytorch -c nvidia conda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==0.13.1 pytorch-cuda=12.1 -c pytorch -c nvidia conda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==0.13.1 cpuonly -c pytorch

  4. 安装 pyg 相关包,包括 torch_geometric、torch_sparse、torch_scatter https://github.com/pyg-team/pytorch_geometric shell pip install pyg_lib torch_scatter torch_sparse torch_cluster torch_spline_conv -f https://data.pyg.org/whl/torch-2.3.1+${CUDA}.html pip install torch_geometric==2.5.3

  5. 安装 numpy 及其他依赖包 shell conda install numpy=1.26.4 pandas

搜集汇总
数据集介绍
main_image_url
构建方式
DGraph数据集的构建基于真实金融场景中的动态图数据,这些数据由随着时间演变的事件和标签构成。通过捕捉用户之间的相互关联和影响,该数据集旨在模拟金融反欺诈任务中的复杂关系网络。具体而言,数据集的构建过程涉及对金融交易、用户行为等多维度数据的采集与整合,确保数据的真实性和代表性。
使用方法
使用DGraph数据集进行研究或开发时,首先需配置相应的实验环境,包括安装Python 3.9.5、PyTorch 2.3.1及PyTorch-geometric等依赖库。随后,可以通过加载数据集进行模型训练,推荐使用如GAT或GraphSAGE等图神经网络模型。在模型训练过程中,可利用MO平台进行性能评估,确保模型的准确性和效率。
背景与挑战
背景概述
在金融行业中,反欺诈一直是核心议题之一。随着互联网金融的快速发展,数字金融反欺诈技术逐渐成为行业标配,其中神经网络技术的应用尤为突出。DGraph数据集正是在这一背景下应运而生,由真实金融场景中的动态事件和标签构成,旨在为金融异常检测提供大规模动态图数据支持。该数据集由专业机构创建,旨在通过图神经网络等先进技术,提升金融风控的精准度和效率,从而有效识别和预防欺诈行为。
当前挑战
DGraph数据集在构建和应用过程中面临多项挑战。首先,金融数据的复杂性和动态性要求模型具备高度的适应性和实时处理能力。其次,数据集的规模庞大,如何在保证模型精度的同时,提高计算效率和模型训练速度,是一个亟待解决的问题。此外,金融领域的数据隐私和安全问题也是一大挑战,如何在数据处理过程中确保用户信息的安全,是数据集应用中不可忽视的重要环节。
常用场景
经典使用场景
在金融领域,DGraph数据集的经典使用场景主要集中在异常检测任务中。通过利用图神经网络(GNN),如GAT和GraphSAGE,该数据集能够有效识别金融交易中的欺诈行为。这些模型通过分析用户之间的关联和交互,捕捉异常模式,从而提升反欺诈系统的准确性和效率。
解决学术问题
DGraph数据集在学术研究中解决了金融领域中的关键问题,即如何在大规模动态图数据中有效检测异常。其提供的真实金融场景数据,使得研究者能够开发和验证新的图神经网络算法,推动了图数据分析技术在金融反欺诈中的应用和发展。
实际应用
在实际应用中,DGraph数据集被广泛用于互联网金融公司的风控系统中。通过训练和优化图神经网络模型,这些公司能够实时监控和预测潜在的欺诈行为,从而减少经济损失并提升客户信任。此外,该数据集还支持金融机构进行风险评估和决策支持。
数据集最近研究
最新研究方向
在金融科技领域,DGraph数据集的最新研究方向主要集中在利用图神经网络(GNN)进行金融异常检测。随着互联网金融的快速发展,欺诈行为日益复杂,传统的反欺诈手段已难以应对。因此,研究者们正致力于开发更为精准和高效的图神经网络模型,如GAT和GraphSAGE,以捕捉用户间的复杂关联和动态行为模式。这些模型不仅能够识别出潜在的欺诈行为,还能在实时风控系统中提供强有力的支持,从而显著提升金融系统的安全性和稳定性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作