SB Curated
收藏github2026-04-30 更新2026-05-01 收录
下载链接:
https://github.com/benqi-finance/smartbugs-curated
下载链接
链接失效反馈官方服务:
资源简介:
SB Curated是一个精选的Solidity智能合约漏洞数据集,用于自动化推理和测试研究。数据集按照DASP分类法组织,包含多种类型的漏洞,如重入、访问控制、算术问题等。
SB Curated is a curated Solidity smart contract vulnerability dataset for automated reasoning and testing research. The dataset is organized according to the DASP taxonomy and covers various vulnerability types such as reentrancy, access control, arithmetic issues, and more.
创建时间:
2026-04-30
原始信息汇总
SB Curated 数据集概述
SB Curated 是一个面向以太坊 Solidity 智能合约自动推理与测试研究的数据集,是 SmartBugs 执行框架 的组成部分,旨在帮助研究人员轻松集成和比较不同分析工具,并实现可复现的实验结果。据项目方介绍,它是同类数据集中规模最大的一个。
漏洞分类
数据集依据 DASP 分类法 对漏洞合约进行组织,涵盖以下 9 种漏洞类型:
| 漏洞类型 | 描述 | 层级 |
|---|---|---|
| 重入 | 可重入的函数调用导致合约行为异常 | Solidity |
| 访问控制 | 未使用函数修饰符或错误使用 tx.origin | Solidity |
| 算术 | 整数溢出/下溢 | Solidity |
| 未检查的低级调用 | call()、callcode()、delegatecall() 或 send() 失败但未被检查 | Solidity |
| 拒绝服务 | 合约因大量耗时计算而瘫痪 | Solidity |
| 不良随机数 | 恶意矿工操纵随机数结果 | 区块链 |
| 抢跑 | 两个调用同一合约的依赖交易被包含在同一区块中 | 区块链 |
| 时间操纵 | 矿工操纵区块时间戳 | 区块链 |
| 短地址 | EVM 接受填充不正确的参数 | EVM |
数据格式与标注
每个合约文件均包含如下注解信息:
- @source:合约来源
- @author:合约作者
- @vulnerable_at_lines:漏洞所在行号
- 漏洞标记:在具体漏洞行后添加注释
// <yes> <report> 漏洞类型
示例:time_manipulation/timed_crowdsale.sol 合约在第 13 行标注了 TIME_MANIPULATION 类型漏洞。
贡献方式
社区可通过提交 Pull Request 的方式添加新合约或更新现有标注,需遵循以下流程:
- 遵循上述注释风格添加合约
- 更新仓库根目录下的
vulnerabilities.json文件(可通过运行scripts/get_vulns_lines.js脚本生成) - 建议使用
python -m json.tool格式化 JSON 文件
引用成果
该数据集已用于多项研究工作,包括:
- ICSE 2020:使用前身版本比较 9 款分析工具,相关合约清单见
ICSE2020_curated_69.txt,结果在独立仓库中公开 - ASE 2020(工具演示):用于评估 Smartcheck 的简单扩展
许可说明
所有合约来源于公开网站或 Etherscan,保留原始许可;其余文件适用仓库内 LICENSE 文件中的许可条款。
搜集汇总
数据集介绍

构建方式
SB Curated数据集精心构建于SmartBugs执行框架之上,旨在为以太坊Solidity智能合约的自动推理与测试研究提供标准化基准。该数据集从公开网站及Etherscan区块链浏览器中系统收集易受攻击的Solidity合约,并依据DASP漏洞分类体系(涵盖重入攻击、访问控制、算术错误等九类典型漏洞)进行结构化组织。每个合约均通过注释详尽标注其来源、作者及脆弱代码行号,并指明具体漏洞类型,便于研究者精确识别与复现。
特点
作为当前规模最大的同类公开数据集,SB Curated展现了卓越的系统性与可复现性。其核心优势在于多维度的标注机制:合约按漏洞类别清晰分目录存储,每条脆弱代码行均附有标准化注释(如'<yes><report> TIME_MANIPULATION'),极大降低了人工审计门槛。此外,数据集紧密集成于SmartBugs框架,支持工具的无缝接入与自动化对比分析,配合开放的社区贡献机制与版本化JSON索引文件,确保数据集的持续演进与研究成果的可追溯性。
使用方法
研究者可直接通过GitHub仓库获取完整合约集合,并利用SmartBugs框架中的集成脚本批量加载与测试。针对具体漏洞类别(如重入攻击),可定位至对应子目录选取标注合约进行分析。对于新增合约,应遵循注释规范补充来源、作者及脆弱行信息,并通过运行scripts/get_vulns_lines.js生成更新后的vulnerabilities.json索引文件,最后以Pull Request形式提交至主仓库。该设计既支持即用型评估,也促进了社区驱动的知识积累。
背景与挑战
背景概述
随着以太坊生态系统的蓬勃发展与去中心化应用的广泛部署,智能合约的安全性已成为区块链技术研究的核心议题。Solidity作为以太坊上最主流的智能合约编程语言,其代码中潜藏的漏洞往往导致巨额数字资产损失,催生了对高质量漏洞数据集的需求。SB Curated正是为应对这一需求而诞生的精品数据集,由SmartBugs执行框架团队创建,相关研究成果发表在ICSE 2020和ASE 2020等顶级会议。该数据集系统性地收录了涵盖重入攻击、访问控制缺陷、算术溢出等九大关键漏洞类别的易受攻击Solidity合约实例,并依据DASP分类体系进行结构化组织。相较于同类资源,SB Curated以其注释的规范性——每条漏洞均标注来源、作者及具体行号——和规模优势,成为目前该领域最具参考价值的基准数据集之一,为自动化推理与测试工具的可复现比较提供了坚实基石。
当前挑战
SB Curated所应对的核心领域挑战在于:智能合约语义复杂性与执行环境特殊性导致传统软件漏洞检测方法失效,现有工具在识别逻辑缺陷(如重入攻击、访问控制绕过)时面临高误报率和低覆盖率的困境。数据集构建过程中遭遇多重技术阻碍:其一,需要从海量公开合约中精准筛选出真实且可验证的漏洞实例,要求对每份合约进行人工审计与多工具交叉验证;其二,为确保证据严谨性,每条漏洞必须精确定位至源码的行级位置并标注多维元数据,对注释标准化的一致性管理形成严峻考验;其三,需同时兼顾漏洞类型的全面覆盖与样本规模的平衡,既要避免样本偏差影响评估结论,又要维持与不断演进的Solidity编译器版本及EVM实现的兼容性,这要求数据集具备持续迭代更新的维护机制。
常用场景
经典使用场景
在区块链安全与智能合约分析领域,SB Curated数据集为研究者提供了一组精心标注的脆弱性Solidity合约。其经典使用场景在于评估和比较静态分析、动态分析及形式化验证工具对智能合约缺陷的检测能力。数据集按照DASP分类法覆盖了重入攻击、算术溢出、未检查的低级调用等九类典型漏洞,并精确标注了每份合约中脆弱代码行的位置与类型,为自动化分析工具的基准测试提供了标准化的测试语料库。
衍生相关工作
围绕SB Curated数据集已衍生出多项具有影响力的研究工作。其中,基于前期版本发表于ICSE 2020的对比研究系统性评估了9款主流分析工具在69份脆弱合约上的表现,揭示了各类工具在检测维度与误报率方面的显著差异。另有一项发表于ASE 2020工具演示专场的工作,利用该数据集验证了Smartcheck扩展方案的有效性。这些成果不仅验证了数据集作为评测基准的实用性,还激发了后续学者对其扩充优化,例如增加新型漏洞类型、引入对抗样本等,进一步巩固了其作为智能合约安全研究基石数据源的地位。
数据集最近研究
最新研究方向
在智能合约安全分析领域,随着去中心化金融(DeFi)生态的蓬勃发展,针对以太坊Solidity智能合约的漏洞检测与自动化验证成为研究热点。SB Curated作为当前规模最大的精心策划型漏洞合约数据集,其依据DASP分类法收录的重入攻击、访问控制缺陷、未检查低层级调用等九类典型漏洞,为学界提供了标准化的基准测试平台。该数据集已被应用于对比九种主流分析工具的实证研究(发表于ICSE 2020),并支撑了基于Smartcheck扩展的自动化工具评估(ASE 2020),显著推动了智能合约安全检测工具的可复现性研究。未来研究方向聚焦于结合大语言模型与形式化验证方法,构建跨漏洞类型的联合检测框架,以应对DeFi协议中日益复杂的组合性安全威胁。
以上内容由遇见数据集搜集并总结生成



