five

Alipay-ECB

收藏
arXiv2025-02-27 更新2025-03-01 收录
下载链接:
https://github.com/zhihuat/Collaborative-AML
下载链接
链接失效反馈
官方服务:
资源简介:
Alipay-ECB是由浙江大学和阿里巴巴集团合作构建的多机构交易数据集。该数据集包含支付宝和电子商务银行超过2亿个账户的数字货币交易信息,涵盖了机构内和机构间的交易。Alipay-ECB是目前可用于分析的最大真实世界交易图数据集,旨在解决跨机构反洗钱问题。

Alipay-ECB is a multi-institution transaction dataset jointly constructed by Zhejiang University and Alibaba Group. This dataset contains digital currency transaction information of over 200 million accounts from Alipay and e-commerce banks, covering both intra-institution and inter-institution transactions. Alipay-ECB is currently the largest real-world transaction graph dataset available for analysis, aiming to address cross-institution anti-money laundering issues.
提供机构:
浙江大学
创建时间:
2025-02-27
搜集汇总
数据集介绍
main_image_url
构建方式
Alipay-ECB数据集的构建基于支付宝和电子商务银行的真实交易数据。该数据集包含了超过2亿个账户和3亿笔交易,涵盖了机构内部交易以及支付宝与电子商务银行之间的交易。数据集的构建旨在反映真实世界中的货币流动,为分析洗钱活动提供支持。
特点
Alipay-ECB数据集的特点在于其规模庞大,真实性强,涵盖了大量账户和交易数据。此外,数据集还包含了机构之间的跨机构交易,这对于检测跨机构的洗钱活动具有重要意义。数据集的构建还考虑了隐私保护,确保了金融机构在共享数据时的安全性和隐私性。
使用方法
Alipay-ECB数据集的使用方法主要包括以下几个方面:首先,通过数据预处理,包括账户分割、交易聚合和交易过滤,以去除噪声数据。其次,利用散列图挖掘算法,对数据集中的交易图进行分析,以识别潜在的洗钱活动。最后,通过比较不同机构之间的交易集,可以发现跨机构的洗钱子图。此外,还可以通过调整参数,如哈希函数的数量和带宽度,来优化算法的性能。
背景与挑战
背景概述
随着金融科技的飞速发展,反洗钱(AML)已成为金融机构面临的一项重大挑战。洗钱活动往往跨越多个金融机构,使得单机构内的检测方法难以奏效。为此,来自浙江大学和阿里巴巴集团的学者们联合提出了一个名为Alipay-ECB的数据集,旨在支持跨机构合作反洗钱,同时保护本地数据的安全和隐私。该数据集包含来自全球最大移动支付平台支付宝和电子商务银行(ECB)的真实数字交易数据,涵盖了超过2亿账户和3亿交易,是目前可用的最大真实世界交易图。通过分析该数据集,研究者们开发了一种新的算法,能够有效地识别跨机构洗钱小组,并在合成数据集上展示了其高效性。
当前挑战
尽管Alipay-ECB数据集为反洗钱研究提供了宝贵的资源,但仍然面临着一些挑战。首先,如何保护金融机构的本地数据安全性和隐私性,同时实现有效的跨机构合作,是一个亟待解决的问题。其次,随着洗钱活动的日益复杂化,如何提高算法的准确性和鲁棒性,以应对更复杂的洗钱模式,也是一个重要的研究课题。此外,由于数据集规模庞大,如何优化算法的效率和通信成本,也是一个需要关注的方面。
常用场景
经典使用场景
在金融领域,Alipay-ECB数据集的经典使用场景是用于反洗钱(AML)的协同检测。该数据集包含了来自支付宝和电子商务银行(ECB)的真实数字交易记录,覆盖了机构内部交易和跨机构交易,是迄今为止最大的真实世界交易图。通过分析这些交易,研究人员可以识别出跨机构的洗钱活动,特别是那些在单个机构内部看似正常的交易活动。
实际应用
Alipay-ECB数据集在实际应用中,可以帮助金融机构更有效地识别和打击洗钱活动。通过分析跨机构交易模式,金融机构可以更准确地识别潜在的洗钱账户和交易,从而采取相应的措施。此外,该数据集还可以用于训练和评估新的反洗钱算法,提高算法的准确性和效率。
衍生相关工作
基于Alipay-ECB数据集的研究,衍生出了一系列相关的经典工作。这些工作主要集中在协同学习算法的开发和优化,以提高反洗钱检测的准确性和效率。例如,利用局部敏感哈希(LSH)和布隆过滤器(Bloom filter)等技术来减少通信成本和提高计算效率。这些研究为金融机构提供了更有效的工具和方法来对抗洗钱活动。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作