比特币交易中,勒索软件研究的数据集
收藏帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-25967.html
下载链接
链接失效反馈官方服务:
资源简介:
Data Set Information: 我们下载并解析了2009年1月至2018年12月的整个比特币交易图表。使用24小时的时间间隔,我们提取网络上的每日交易,并形成比特币图。我们过滤掉传输小于B0.3的网络边缘,因为赎金金额很少低于此阈值。 勒索软件地址取自三项广泛采用的研究:蒙特利尔、普林斯顿和帕多瓦。请参阅BitcoinHeist文章以获取参考。 Attribute Information: 特征: 地址:String。比特币地址。 年份:整数。年 日期:整数。一年中的某一天。1是第一天,365是最后一天。 长度:整数。 重量:浮球。 计数:整数。 循环:整数。 邻居:整数。 收入:整数。Satoshi金额(1比特币=1亿Satoshi)。 标签:类别字符串。勒索软件系列的名称(例如CryptoXXX、cryptolocker等)或白色(即未知勒索软件)。 我们的图形功能旨在量化特定的事务模式。循环旨在计算有多少交易i)分割他们的硬币;ii)使用不同的路径在网络中移动这些硬币,最后,以及iii)将它们合并到一个地址中。在这个最终地址的硬币可以出售并转换成法定货币。权重量化了合并行为(即,交易的输入地址多于输出地址),其中多个地址中的硬币分别通过一系列合并交易传递,并累积在最终地址中。与权重类似,计数特征用于量化合并模式。但是,计数功能表示交易数量的信息,而权重功能表示交易金额的信息(这些交易的百分比是多少?€?输出?)。长度设计用于量化比特币上的混合轮次,即交易在多个轮次中接收和分发相似数量的硬币,并使用新创建的地址隐藏硬币来源。 白色比特币地址上限为每天1K(比特币每天有800K地址)。 请注意,尽管我们对勒索软件标签有一定的了解,但我们不知道所有白色地址实际上是否与勒索软件无关。 与非勒索软件地址相比,勒索软件地址在特征值分布上表现出更深刻的右偏态。 Relevant Papers: 1 - Goldsmith, D., Grauer, K., & Shmalo, Y. (2020). Analyzing hack subnetworks in the bitcoin transaction graph. Applied Network Science, 5, 1-20. 2 - Rivera-Castro, R., Pilyugina, P., & Burnaev, E. (2019, November). Topological Data Analysis for Portfolio Management of Cryptocurrencies. In 2019 International Conference on Data Mining Workshops (ICDMW) (pp. 238-243). IEEE. Citation Request: @article{akcora2019bitcoinheist, title={BitcoinHeist: Topological Data Analysis for Ransomware Detection on the Bitcoin Blockchain}, author={Akcora, Cuneyt Gurcan and Li, Yitao and Gel, Yulia R and Kantarcioglu, Murat}, journal={arXiv preprint [Web link]}, year={2019} } Cuneyt Gurcan Akcora (cuneyt.akcora '@' umanitoba.ca) University of Manitoba, Canada Yulia Gel (ygl '@' utdallas.edu) University of Texas at Dallas, USA Murat kantarcioglu (muratk '@' utdallas.edu) University of Texas at Dallas, USA
提供机构:
帕依提提



