Ransomware in the Bitcoin Ecosystem
收藏github2022-05-19 更新2024-05-31 收录
下载链接:
https://github.com/behas/ransomware-dataset
下载链接
链接失效反馈官方服务:
资源简介:
本数据集包含勒索软件种子数据集及其扩展过程,详细描述了比特币生态系统中的勒索软件支付情况。
This dataset encompasses a ransomware seed dataset and its expansion process, providing a detailed description of ransomware payment activities within the Bitcoin ecosystem.
创建时间:
2017-09-24
原始信息汇总
数据集概述
数据集名称
Ransomware in the Bitcoin Ecosystem
数据来源
该数据集源自论文《Ransomware Payments in the Bitcoin Ecosystem》,并通过GraphSense Cryptocurrency Analytics平台(版本0.3.1)进行数据提取。
数据集内容
- 种子地址数据集:包含收集的勒索软件种子地址,位于
data/seed_addresses.csv文件中。 - 完整扩展数据集:可通过链接https://zenodo.org/record/1238041#.WumE2dNuZR4下载完整的扩展数据集。
使用方法
- 运行此提取任务需要一个运行中的GraphSense集群及所有预计算数据。
- 在运行任务前,需在
./execute.sh和./src/main/scala/at/ac/ait/RansomwareDataset.scala中替换指向SPARK-MASTER、至少两个CASSANDRA节点以及任务的目标HDFS路径。 - 通过运行
./execute.sh来执行任务。
搜集汇总
数据集介绍

构建方式
该数据集的构建基于开源平台GraphSense Cryptocurrency Analytics(v.0.3.1),通过提取比特币生态系统中与勒索软件相关的种子地址,并结合预计算数据进行扩展。具体而言,种子地址数据来源于公开的勒索软件支付记录,并通过GraphSense平台的分析功能进一步扩展,生成了完整的勒索软件相关地址数据集。这一过程确保了数据的全面性和准确性。
特点
该数据集的特点在于其专注于比特币生态系统中勒索软件支付的地址信息,涵盖了从种子地址到扩展地址的完整链条。数据集不仅提供了原始的种子地址文件,还通过GraphSense平台的计算能力,生成了更为广泛的地址关联数据。这种多层次的数据结构为研究勒索软件在比特币网络中的行为模式提供了丰富的分析基础。
使用方法
使用该数据集需要部署GraphSense平台并配置相关的计算环境,包括SPARK-MASTER和CASSANDRA节点。用户需在`execute.sh`和`RansomwareDataset.scala`文件中替换相应的配置参数,然后通过运行`execute.sh`脚本来执行数据提取任务。此外,用户也可以直接从Zenodo平台下载完整的扩展数据集,以便快速开展研究工作。
背景与挑战
背景概述
《Ransomware in the Bitcoin Ecosystem》数据集由研究人员于2018年创建,旨在深入分析比特币生态系统中勒索软件支付行为。该数据集基于开源平台GraphSense Cryptocurrency Analytics(v.0.3.1)构建,收录了勒索软件相关的比特币地址及其扩展数据。研究团队通过该数据集揭示了勒索软件在比特币网络中的资金流动模式,为加密货币领域的反洗钱和网络安全研究提供了重要支持。该数据集的核心研究问题聚焦于勒索软件支付的追踪与分析,其研究成果对加密货币监管和区块链安全领域产生了深远影响。
当前挑战
该数据集在构建过程中面临多重挑战。首先,勒索软件支付的匿名性和比特币网络的去中心化特性使得数据采集和验证极为复杂,研究人员需依赖高级分析工具如GraphSense来提取和扩展数据。其次,数据集的扩展过程依赖于分布式计算环境(如Spark和Cassandra),这对计算资源和数据处理能力提出了较高要求。此外,勒索软件行为的动态变化和比特币地址的频繁更替也为数据的时效性和完整性带来了持续挑战。这些技术难题不仅考验了数据集的构建方法,也为后续研究提供了改进方向。
常用场景
经典使用场景
在加密货币研究领域,'Ransomware in the Bitcoin Ecosystem'数据集被广泛用于分析勒索软件在比特币生态系统中的支付行为。研究者通过该数据集深入探讨了勒索软件地址的交易模式、资金流动路径以及与其他比特币地址的交互关系,为理解加密货币的非法使用提供了重要数据支持。
解决学术问题
该数据集有效解决了加密货币研究中关于勒索软件支付行为的量化分析难题。通过提供详细的勒索软件地址及其扩展数据,研究者能够追踪资金流向、识别交易模式,并评估勒索软件对加密货币生态的影响。这些研究成果为制定反洗钱政策和加强区块链安全提供了理论依据。
衍生相关工作
基于该数据集,研究者们开展了多项经典工作,例如开发了用于检测勒索软件交易的机器学习模型,以及构建了比特币交易网络的动态分析框架。这些工作不仅深化了对勒索软件行为的理解,还推动了加密货币分析技术的发展,为后续研究提供了重要的方法论和数据基础。
以上内容由遇见数据集搜集并总结生成



