智能合约漏洞检测数据集

Name: 智能合约漏洞检测数据集
Creator: 海南大学网络空间安全学院
Published: 2025-04-07 20:32:14
License: 暂无描述

arXiv2025-04-07 更新2025-04-09 收录

下载链接：

http://arxiv.org/abs/2504.05006v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由海南大学网络空间安全学院创建，包含215个真实世界的DApp项目，共4998个智能合约。数据集旨在用于智能合约漏洞检测，特别是针对机器难以审核的逻辑错误，如代币价格操纵等。数据集的构建通过从Code4rena和Slowmist平台收集审计过的合同项目，并使用SmartCollect工具获取完整的DApp项目依赖合同。数据集还采用了随机过采样技术以解决数据不平衡问题，以提高模型的检测性能。

This dataset was developed by the School of Cyberspace Security, Hainan University. It contains 215 real-world DApp projects, with a total of 4998 smart contracts. The dataset is designed for smart contract vulnerability detection, especially targeting logic errors that are difficult for machines to audit, such as token price manipulation. The dataset was constructed by collecting audited contract projects from the Code4rena and Slowmist platforms, and utilizing the SmartCollect tool to acquire complete dependent contracts of DApp projects. Additionally, random oversampling technology was adopted to resolve the data imbalance problem, thereby enhancing the detection performance of models.

提供机构：

海南大学网络空间安全学院

创建时间：

2025-04-07

搜集汇总

数据集介绍

构建方式

在区块链安全研究领域，构建具有代表性的智能合约漏洞检测数据集面临真实性与复杂性的双重挑战。本研究通过开发SmartCollect工具系统性地采集了215个真实DApp项目的4,998份智能合约，覆盖Code4rena和Slowmist等审计平台的完整项目依赖链，包括OpenZeppelin等公共库合约。数据集特别纳入23个具有代币价格操纵漏洞的合约样本，并采用SWC Registry标准标注漏洞类型，通过JSON结构化存储实现多维度分析。为解决数据不平衡问题，创新性地应用随机过采样(ROS)技术增强少数类样本表征。

特点

该数据集显著区别于传统简化基准的三大特征：首先，完整保留真实DApp项目的多合约交互拓扑，平均合约规模远超现有基准40行代码的限制；其次，重点涵盖价格操纵等83%难以机器审计的逻辑漏洞，填补了非机器可审计漏洞研究的数据空白；最后，通过依赖恢复技术确保项目完整性，包含外部库合约的完整调用链。实验表明，基于该数据集微调的LLaMA3-8B模型在价格操纵漏洞检测中达到0.97精确度与0.68召回率。

使用方法

研究者可通过两种范式利用该数据集：其一，采用全参数微调(FFT)或低秩适配(LoRA)技术构建领域专用检测模型，建议配合ROS数据增强策略以提升小样本漏洞检测效果；其二，基于预设的审计-验证双角色提示模板，开展零样本或少样本的上下文学习。数据集的标准JSON格式支持端到端训练流水线，其中消息字段包含系统角色定义、合约源码及漏洞类型标注，便于适配不同架构的LLM微调需求。

背景与挑战

背景概述

智能合约漏洞检测数据集由海南大学网络空间安全学院的Jiuyang Bu等研究人员于2024年提出，旨在解决去中心化应用（DApps）中智能合约的安全漏洞问题。该数据集包含215个真实世界的DApp项目，共计4,998个合约，特别关注了难以检测的逻辑错误，如代币价格操纵漏洞。通过微调大型语言模型（LLMs），如Llama3-8B和Qwen2-7B，该研究在漏洞检测任务中取得了显著的性能提升，F1分数达到0.83。这一数据集填补了现有简化基准的不足，为区块链生态系统的安全保护提供了有力支持。

当前挑战

智能合约漏洞检测数据集面临的挑战主要包括两个方面：首先，在领域问题方面，智能合约漏洞的多样性和复杂性使得传统检测方法难以应对，尤其是那些难以通过机器审计的逻辑错误。其次，在构建过程中，数据集的收集和标注面临巨大挑战，包括合约代码的复杂性、依赖关系的处理以及数据不平衡问题。此外，如何有效利用大型语言模型进行微调，以提高漏洞检测的准确性和泛化能力，也是一个重要的技术挑战。

常用场景

经典使用场景

在区块链安全领域，智能合约漏洞检测数据集被广泛应用于训练和评估基于大型语言模型（LLM）的漏洞检测系统。该数据集包含来自215个真实世界DApp项目的4,998份智能合约，涵盖了重入攻击、算术漏洞等传统漏洞类型，以及难以通过传统方法检测的逻辑错误，如代币价格操纵漏洞。研究人员利用该数据集对Llama3-8B和Qwen2-7B等开源LLM进行全参数微调（FFT）和低秩适应（LoRA）微调，显著提升了模型在智能合约漏洞检测任务中的性能表现。

衍生相关工作

该数据集催生了一系列创新研究：COBRA工具实现了交互感知的字节码级漏洞检测；DeFiTail提出了跨合约执行分析方法；SCALM探索了LLM在智能合约坏味道检测中的应用。这些工作共同推进了智能合约安全分析从单合约检测向多合约系统分析的演进，形成了包含静态分析、符号执行和AI检测的混合分析技术体系。

数据集最近研究