Solana区块链失败交易数据集
收藏arXiv2025-04-25 更新2025-05-08 收录
下载链接:
https://doi.org/10.1145/3728943
下载链接
链接失效反馈官方服务:
资源简介:
本研究的数据集是Solana区块链上超过15亿个失败交易的数据集,涵盖了超过7200万个区块。该数据集由非投票交易组成,包括成功和失败交易,并从2023年8月1日至2024年7月31日。该数据集旨在帮助理解Solana区块链上失败交易的特征和影响,并促进对Solana生态系统的优化。
The dataset for this study is a collection of over 1.5 billion failed transactions on the Solana blockchain, covering more than 72 million blocks. It consists of non-voting transactions, including both successful and failed ones, and spans from August 1, 2023 to July 31, 2024. This dataset aims to assist in understanding the characteristics and impacts of failed transactions on the Solana blockchain, and facilitate the optimization of the Solana ecosystem.
提供机构:
浙江大学
创建时间:
2025-04-25
搜集汇总
数据集介绍

构建方式
Solana区块链失败交易数据集通过大规模实证研究构建,涵盖了从2023年8月1日至2024年7月31日期间超过15亿笔失败交易。研究团队采用分层抽样策略,每周随机选取一天,确保工作日和周末的平衡代表,最终从72,123,900个区块中筛选出10,458,452个区块进行分析。数据收集过程包括从Solana区块链通过RPC节点获取区块信息,过滤掉投票交易,并提取非投票交易的详细信息,如区块号、时间戳、交易哈希、账户输入、签名者、交易费用、计算单元消耗、交易日志消息以及引发错误的程序地址和指令。此外,还收集了与Solana程序相关的链下数据,包括程序公共名称和源代码。
特点
该数据集的特点在于其全面性和细致性。它不仅包含了大量的失败交易记录,还涵盖了交易的多维度信息,如交易费用、计算单元消耗和错误日志消息。数据集特别关注了交易失败的类型和原因,识别出了10种不同的错误类型,其中价格或利润不符、无效状态和有效期过期是最常见的三种错误,占总失败交易的84.90%。此外,数据集还区分了由机器人和人类用户发起的交易,揭示了机器人账户的高失败率(58.43%)与人类账户的低失败率(6.22%)之间的显著差异。
使用方法
该数据集的使用方法多样,适用于区块链生态系统分析、交易失败原因研究和智能合约优化。研究人员可以通过分析数据集中的错误类型和交易特征,识别Solana网络中的常见问题和瓶颈。开发者可以利用这些数据优化智能合约设计,减少交易失败率。此外,数据集还可用于构建预测模型,预测交易失败的可能性,从而帮助用户优化交易策略。数据集中的链下数据(如程序源代码)为深入分析程序逻辑和错误根源提供了可能。未来研究可以基于此数据集探索更多区块链性能优化和安全增强的方向。
背景与挑战
背景概述
Solana区块链失败交易数据集由浙江大学、新加坡管理大学及杭州高新区(滨江)区块链与数据安全研究院的研究团队于2025年创建,旨在填补对Solana区块链上失败交易特性及其影响的理解空白。Solana作为新兴的高吞吐量、低交易成本区块链平台,在去中心化金融(DeFi)和非同质化代币(NFT)等领域具有重要地位。然而,其低交易成本也导致大量机器人活动,引发交易失败率高和网络拥堵问题。该数据集包含超过15亿条失败交易记录,覆盖7200多万个区块,为研究Solana生态系统的交易失败模式及其对网络性能的影响提供了重要资源。
当前挑战
Solana区块链失败交易数据集面临的主要挑战包括:1)领域问题挑战:高失败率交易(如机器人发起的交易失败率高达58.43%)对网络性能和用户体验造成负面影响,尤其是在网络拥堵期间;2)构建过程挑战:数据集的构建涉及从Solana区块链中提取和分析大规模交易数据,包括处理复杂的交易日志和错误消息分类。此外,区分机器人账户和人类账户的行为模式,以及识别和分类交易失败的具体原因(如价格未满足、无效状态等)也是构建过程中的重要挑战。
常用场景
经典使用场景
Solana区块链失败交易数据集在研究高频交易、网络拥塞及智能合约交互失效等场景中具有重要价值。该数据集通过分析超过15亿笔失败交易,揭示了交易失败的时间模式、错误类型分布及其与特定程序(如DEX聚合器和AMM)的关联性,为优化交易执行策略和网络资源分配提供了实证基础。
解决学术问题
该数据集填补了Solana生态系统中交易失败特征研究的空白,系统性地解决了以下学术问题:1) 量化了机器人账户(58.43%)与人类账户(6.22%)的失败率差异;2) 识别出10类核心错误类型,其中价格不匹配(47.99%)和无效状态(19.19%)占比最高;3) 揭示了失败交易在区块中的深度分布(中位数592位)与计算资源分配低效性的关联。这些发现为区块链交易可靠性理论提供了新的维度。
衍生相关工作
基于该数据集衍生的经典工作包括:1) Solana智能合约漏洞检测工具VRust和FuzzDelSol的增强版,新增针对无效状态错误的静态分析规则;2) 跨链比较研究(如以太坊与Solana失败模式对比),揭示不同共识机制对交易可靠性的影响;3) 机器人行为识别模型改进,通过分析失败交易特征提升检测准确率至96.91%。这些工作推动了区块链工程领域的实证研究方法论发展。
以上内容由遇见数据集搜集并总结生成



