ORBITAAL
收藏arXiv2024-08-26 更新2024-08-28 收录
下载链接:
https://doi.org/10.5281/zenodo.12581515
下载链接
链接失效反馈官方服务:
资源简介:
ORBITAAL数据集是由LIRIS UMR 5205 CNRS等机构创建的比特币实体间交易时间图数据集,涵盖了2009年至2021年的所有比特币交易。该数据集以时间图的形式提供了比特币交易的流图和快照图表示,每笔交易的价值以比特币和美元(基于每日汇率)给出。数据集的创建过程包括从区块链中提取数据,转换为可解析格式,并通过地址聚类技术识别用户。ORBITAAL数据集主要应用于经济和网络科学领域,特别是在比特币交易网络的分析和大型网络分析工具的开发中。
The ORBITAAL dataset is a temporal graph dataset capturing inter-entity Bitcoin transactions, developed by institutions including LIRIS UMR 5205 CNRS, covering all Bitcoin transactions spanning from 2009 to 2021. This dataset provides both flow graph and snapshot graph representations of Bitcoin transactions in the temporal graph framework, with the value of each transaction specified in both Bitcoin and USD (based on daily exchange rates). The development pipeline of the ORBITAAL dataset involves extracting raw data from the Bitcoin blockchain, converting the data into a machine-parsable format, and identifying users via address clustering techniques. The ORBITAAL dataset is primarily applied in the fields of economics and network science, particularly for Bitcoin transaction network analysis and the development of large-scale network analysis tools.
提供机构:
LIRIS UMR 5205 CNRS / Universite Claude Bernard Lyon 1 / INSA Lyon / Université Lumière Lyon 2 / École Centrale de Lyon
创建时间:
2024-08-26
搜集汇总
数据集介绍

构建方式
ORBITAAL数据集的构建始于完整比特币区块链的下载与同步,随后将原始的二进制格式数据转换为JSON格式以便于解析。在数据丰富化阶段,为每个交易输入地址补充了相应的比特币地址信息。接着,通过地址聚类方法,将比特币地址关联到用户,使用了共输入启发式算法和WalletExplorer数据库进行用户身份的推断。将原始的地址到地址的交易转换为用户到用户的交易,并引入了专门的“矿工节点”来表示矿工获得的奖励和支付的费用。最终,数据集被转换为两种标准的时态图格式:流图和快照序列,以适应不同的时间尺度分析。
使用方法
使用ORBITAAL数据集时,用户可以通过Python的Pandas或Pyspark库加载.parquet格式的图数据。数据集提供了详细的用户信息和交易网络,适用于大型网络分析工具,如SNAP、Networkit或Raphtory。对于流图和快照序列的分析,研究者可以应用标准网络度量方法,如节点贡献、节点度数、强连通分量、直径和平均最短路径等,以揭示比特币交易网络的结构变化和活动趋势。
背景与挑战
背景概述
比特币作为首个现代加密货币,其交易数据对于经济学和网络科学领域的研究具有重要意义。ORBITAAL数据集,由法国LIRIS UMR 5205 CNRS等机构的研究人员C´elestin Coquid´e和R´emy Cazabet创建,旨在为研究者提供一个基于时间图形式主义的比特币交易数据集。该数据集涵盖了从2009年1月至2021年1月的所有比特币交易,以时间图表示实体之间的交易网络,并提供快照和流图两种形式。此外,该数据集还提供了实体的详细信息,如全球比特币余额和关联的公开地址。ORBITAAL数据集的创建填补了现有比特币数据集在时间图分析方面的空白,为研究比特币交易网络和经济发展提供了重要的数据支持。
当前挑战
ORBITAAL数据集在构建过程中面临着一些挑战。首先,比特币协议的特性和数据的丰富性使得原始区块链数据难以直接进行分析。其次,将原始数据转换为可分析的网络结构需要复杂的预处理步骤。此外,地址聚类过程中可能存在信息损失,例如,用户地址的细节和同时发生的多笔交易信息可能会丢失。最后,构建时间图时需要选择合适的时间尺度,以便更好地捕捉比特币交易网络的结构变化。
常用场景
经典使用场景
ORBITAAL数据集在研究比特币交易网络的结构和动态方面具有经典的使用场景。研究者可以利用该数据集提供的流图和快照图,分析比特币交易的时间序列特征,包括交易量、交易频率、用户活跃度等。此外,该数据集还包含了用户的生命周期信息,使得研究者可以探究用户行为随时间的变化,以及不同时间段内用户行为的特点。
解决学术问题
ORBITAAL数据集解决了比特币交易网络分析中的多个学术研究问题。首先,它提供了一个完整且易于分析的比特币交易数据集,避免了传统数据集需要复杂预处理步骤的问题。其次,它提供了两种时间图表示:流图和快照图,使得研究者可以根据不同的研究需求选择合适的表示方式。此外,该数据集还包含了用户的生命周期信息,使得研究者可以探究用户行为随时间的变化,以及不同时间段内用户行为的特点。
实际应用
ORBITAAL数据集在实际应用场景中具有重要的价值。它可以用于构建比特币交易网络的可视化工具,帮助用户直观地了解比特币交易的网络结构和动态。此外,该数据集还可以用于开发比特币交易网络的预测模型,帮助预测比特币交易的未来趋势。最后,该数据集还可以用于开发比特币交易网络的监测系统,帮助识别可疑交易和潜在的风险。
数据集最近研究
最新研究方向
在加密货币与网络科学的交叉领域,ORBITAAL数据集代表了比特币交易研究的一个里程碑。该数据集不仅提供了从2009年到2021年的比特币交易数据,而且以其时间图的形式主义为研究者提供了一个全新的视角。ORBITAAL数据集的发布,使得对比特币交易网络的动态分析成为可能,这对于理解加密货币的经济网络和用户行为具有重要意义。此外,该数据集还提供了用户的生命周期信息、余额和地址列表,这些详细信息为研究者提供了深入了解比特币用户行为和交易模式的机会。ORBITAAL数据集的发布,填补了比特币数据集在时间图分析领域的空白,为加密货币和大数据分析领域的研究提供了新的可能性。
相关研究论文
- 1ORBITAAL: A Temporal Graph Dataset of Bitcoin Entity-Entity TransactionsLIRIS UMR 5205 CNRS / Universite Claude Bernard Lyon 1 / INSA Lyon / Université Lumière Lyon 2 / École Centrale de Lyon · 2024年
以上内容由遇见数据集搜集并总结生成



