SCRUBD

Name: SCRUBD
Creator: 印度理工学院坎普尔分校
Published: 2024-12-13 15:43:58
License: 暂无描述

arXiv2024-12-13 更新2024-12-17 收录

下载链接：

https://github.com/sujeetc/SCRUBD, https://scaudit.cse.iitk.ac.in

下载链接

链接失效反馈

官方服务：

资源简介：

SCRUBD是由印度理工学院坎普尔分校开发的智能合约漏洞数据集，旨在评估智能合约中的重入（RE）和未处理异常（UX）漏洞。数据集包含两个子集：SCRUBD/CD（众包数据集）和SCRUBD/SD（合成数据集）。SCRUBD/CD通过众包和专家手动检查标注了469个合约中的746个RE函数和566个UX函数，而SCRUBD/SD则通过手动合成的方式覆盖了多种RE漏洞场景，包含239个函数。该数据集主要用于评估智能合约漏洞检测工具的性能，旨在解决智能合约安全性评估中的标准化数据集缺失问题。

SCRUBD is a smart contract vulnerability dataset developed by the Indian Institute of Technology Kanpur, designed to evaluate reentrancy (RE) and unhandled exception (UX) vulnerabilities in smart contracts. The dataset comprises two subsets: SCRUBD/CD (Crowdsourced Dataset) and SCRUBD/SD (Synthetic Dataset). SCRUBD/CD annotates 746 RE functions and 566 UX functions across 469 contracts through crowdsourcing and manual expert inspection. SCRUBD/SD covers various RE vulnerability scenarios via manual synthesis, containing 239 functions. This dataset is primarily used to evaluate the performance of smart contract vulnerability detection tools, aiming to address the shortage of standardized datasets in smart contract security assessment.

提供机构：

印度理工学院坎普尔分校

创建时间：

2024-12-13

搜集汇总

数据集介绍

构建方式

SCRUBD数据集通过两种不同的方式构建，以覆盖智能合约中的重入（RE）和未处理异常（UX）漏洞。首先，SCRUBD/CD（众包数据集）通过众包方式收集，学生们在网站上标记智能合约函数是否存在RE或UX漏洞，随后由专家进行手动审查和验证。其次，SCRUBD/SD（合成数据集）则是通过专家手动设计，涵盖了多种RE漏洞场景，包括数据依赖、控制依赖等复杂情况。

特点

SCRUBD数据集的特点在于其多样性和真实性。SCRUBD/CD包含了469个真实世界的智能合约，涵盖了746个RE漏洞函数和566个UX漏洞函数，确保了数据集的广泛覆盖。SCRUBD/SD则专注于RE漏洞的复杂场景，提供了155个易受攻击的函数和84个非易受攻击的函数，允许研究人员测试工具在不同场景下的表现。

使用方法

SCRUBD数据集可用于评估和改进现有的智能合约漏洞检测工具。研究人员可以通过SCRUBD/CD评估工具在真实世界中的表现，而SCRUBD/SD则用于测试工具在复杂RE场景下的性能。此外，SCRUBD还可用于训练基于机器学习的漏洞检测模型，帮助开发更高效的智能合约安全工具。

背景与挑战

背景概述

SCRUBD（Smart Contracts Reentrancy and Unhandled Exceptions Vulnerability Dataset）是由印度理工学院坎普尔分校和海得拉巴分校的研究团队于2024年创建的智能合约漏洞数据集。该数据集专注于智能合约中的重入（Reentrancy, RE）和未处理异常（Unhandled Exceptions, UX）漏洞，旨在为智能合约漏洞检测工具的评估提供标准化的测试基准。SCRUBD由两个子数据集组成：SCRUBD/CD（众包数据集）和SCRUBD/SD（合成数据集）。SCRUBD/CD通过众包方式标注，并由专家手动验证，覆盖了RE和UX漏洞；SCRUBD/SD则通过人工设计，专注于RE漏洞的复杂场景。该数据集的发布填补了现有智能合约漏洞数据集的空白，为工具评估和研究提供了高质量的基准。

当前挑战

SCRUBD数据集的构建面临多重挑战。首先，智能合约漏洞的复杂性和多样性使得标注过程极具挑战，尤其是在众包标注中，确保标注的准确性和一致性是一个难点。其次，现有的智能合约漏洞数据集存在标注不准确、覆盖场景有限等问题，SCRUBD通过众包和专家验证相结合的方式，试图解决这些问题。此外，合成数据集的构建需要深入理解RE漏洞的多种场景，确保测试用例能够覆盖复杂的漏洞模式。最后，评估现有工具的性能时，如何公平地比较不同工具在不同数据集上的表现也是一个挑战。SCRUBD通过提供统一的测试基准，帮助研究者更好地评估和改进智能合约漏洞检测工具。

常用场景

经典使用场景

SCRUBD数据集的经典使用场景主要集中在智能合约漏洞检测工具的评估与优化上。通过提供真实世界和合成生成的智能合约样本，SCRUBD允许研究人员对现有的漏洞检测工具进行全面评估，特别是在检测重入漏洞（RE）和未处理异常（UX）方面。该数据集不仅涵盖了多种复杂的漏洞场景，还提供了详细的标注信息，使得工具的性能评估更加准确和可靠。

解决学术问题

SCRUBD数据集解决了智能合约漏洞检测领域中缺乏标准化评估基准的问题。现有的漏洞检测工具依赖于不同的数据集，导致工具之间的性能比较困难。SCRUBD通过提供高质量的标注数据，填补了这一空白，使得研究人员能够在一个统一的基准上比较不同工具的性能。此外，SCRUBD还揭示了现有数据集中存在的标签错误问题，进一步提升了漏洞检测研究的准确性和可靠性。

衍生相关工作

SCRUBD数据集的发布催生了一系列相关的研究工作，特别是在智能合约漏洞检测工具的改进和评估方面。基于SCRUBD的研究表明，Slither在检测重入漏洞和未处理异常方面表现优异，而Sailfish则在处理复杂的重入漏洞场景中表现突出。此外，SCRUBD还启发了对现有数据集（如Turn-The-Rudder）的重新评估，揭示了其中存在的标签错误问题。这些研究为智能合约安全领域的进一步发展提供了重要的参考和指导。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集