five

JiuZhou

收藏
github2025-10-28 更新2025-10-29 收录
下载链接:
https://github.com/sa-ignaciow/jiuzhoa
下载链接
链接失效反馈
官方服务:
资源简介:
JiuZhou是一个以太坊缺陷智能合约的数据集,遵循IEEE标准分类,将以太坊智能合约漏洞分为9个类别共49种类型,提供每种漏洞的简要介绍和测试用例,帮助开发者和研究人员了解以太坊安全状况并获取基准数据集

JiuZhou is a dataset of vulnerable Ethereum smart contracts. It adheres to IEEE standard classification, categorizing Ethereum smart contract vulnerabilities into 9 categories encompassing 49 distinct types. The dataset provides brief introductions and test cases for each vulnerability type, aiming to assist developers and researchers in understanding the security landscape of Ethereum and acquiring benchmark datasets.
创建时间:
2025-10-28
原始信息汇总

JiuZhou(九州)数据集概述

数据集简介

JiuZhou是一个以太坊智能合约统计和分类的数据集合。该数据集遵循IEEE 1044-2009软件异常分类标准,将以太坊智能合约漏洞分为9个大类,共包含49种具体漏洞类型。

核心特征

  • 为每种漏洞提供简要介绍和测试用例
  • 帮助智能合约开发者和研究人员了解以太坊安全现状
  • 为测试智能合约分析工具提供基准数据集

漏洞来源

  1. 通过检索IEEE和ACM数据库中2014年后发表的论文获取漏洞信息
  2. 通过检索GitHub上的以太坊智能合约项目获取漏洞信息
  3. 关注以太坊官方资源获取漏洞信息
  4. 已移除所有已修复的漏洞

漏洞分类体系

  1. 数据类:数据定义、初始化、映射、访问或使用中的漏洞
  2. 接口类:接口规范或实现中的漏洞
  3. 逻辑类:决策逻辑、分支、排序或计算算法中的漏洞
  4. 描述类:软件描述、使用、安装或操作中的漏洞
  5. 标准类:与定义标准不符的漏洞
  6. 安全类:威胁合约安全的漏洞
  7. 性能类:导致gas消耗增加的漏洞
  8. 交互类:合约与其他账户交互引起的漏洞
  9. 环境类:支持以太坊智能合约的软件错误导致的漏洞

测试用例

  • 测试用例来源于其他GitHub项目或手动编写
  • 转载的测试用例会标明来源
  • 手动编写的测试用例标记为JiuZhou
  • 会部分重写测试用例以适配更新的Solidity语言版本
  • 为每个测试用例提供字节码文件

误导合约

  • 本质上是无漏洞合约
  • 手动编写,包含某些漏洞特征但被上下文中的其他语句修复
  • 用于测试智能合约分析工具的上下文分析能力

许可证

JiuZhou基于MIT许可证发布,转载时需注明来源。

搜集汇总
数据集介绍
main_image_url
构建方式
在区块链安全研究领域,JiuZhou数据集的构建遵循了系统化的文献与开源项目检索流程。研究团队采用四组核心关键词对IEEE和ACM数据库中2014年后的学术文献进行检索,同时结合GitHub平台上266个以太坊智能合约项目的详细审查,辅以以太坊官方文档、技术博客及社区讨论等多元渠道,最终通过人工校验提取出未经修复的智能合约缺陷案例。
特点
该数据集以IEEE 1044-2009软件异常分类标准为理论框架,将智能合约漏洞划分为数据、接口、逻辑等九大类别,涵盖49种具体缺陷类型。每个缺陷均配备简明技术说明与可执行测试案例,部分案例经人工重写以适配新版Solidity语言规范。特别设计的误导性合约案例,通过上下文语义消解表面缺陷特征,为分析工具提供抗干扰能力验证场景。
使用方法
开发者可通过分类图谱快速定位目标缺陷类型,利用标注来源的测试案例进行智能合约安全分析工具基准测试。数据集提供的字节码文件支持静态分析与动态执行双重验证模式,研究者在引用时需遵循MIT许可协议标注来源。该资源既可用于智能合约开发中的缺陷模式识别训练,也可作为量化评估安全检测工具精确度的标准数据集。
背景与挑战
背景概述
JiuZhou数据集作为以太坊智能合约缺陷分类体系的重要成果,由研究团队于2020年前后构建完成,其核心目标在于系统化梳理智能合约的安全漏洞模式。该数据集严格遵循IEEE 1044-2009软件异常分类标准,将智能合约缺陷归纳为数据、接口、逻辑等九大类别共49种具体漏洞类型,为智能合约开发者与安全分析工具提供了标准化评估基准。通过整合IEEE/ACM学术文献、GitHub开源项目及以太坊官方文档等多源数据,JiuZhou不仅建立了完整的缺陷分类图谱,还配备了详尽的测试案例与字节码文件,显著推动了智能合约形式化验证与自动化检测领域的研究进程。
当前挑战
在智能合约安全分析领域,JiuZhou致力于解决多维度技术挑战:其首要任务在于应对智能合约漏洞的异构性特征,需在兼顾Solidity语言特性与以太坊虚拟机运行机制的基础上,实现漏洞模式的精准归因;其次,数据集构建过程中面临原始数据碎片化难题,研究团队需通过人工校验266个GitHub项目及跨平台文档,确保缺陷样本的真实性与完整性。此外,测试案例的适配性构成另一重挑战,需持续跟进Solidity语言版本迭代,对移植案例进行语义重构,同时设计无缺陷误导性合约以检验分析工具的上下文推理能力。
常用场景
经典使用场景
在区块链安全研究领域,JiuZhou数据集凭借其系统化的漏洞分类体系,成为智能合约安全分析的核心基准。研究者广泛利用该数据集评估静态和动态分析工具的检测能力,通过模拟真实漏洞场景验证工具在识别逻辑缺陷、数据异常及安全威胁方面的有效性。其标准化测试案例为学术界提供了可复现的实验环境,显著推动了智能合约漏洞检测方法的横向比较与性能优化。
解决学术问题
该数据集通过IEEE标准构建的九类四十九种漏洞分类框架,有效解决了智能合约安全研究中的分类体系缺失问题。其涵盖数据定义、接口规范、逻辑运算等多维度的漏洞类型,为量化分析以太坊智能合约缺陷分布规律提供了实证基础。通过整合学术文献与开源项目数据,建立了连接理论研究与工程实践的桥梁,助力研究者系统揭示智能合约脆弱性的内在机理与演化特征。
衍生相关工作
基于JiuZhou的标准化分类体系,衍生出多项具有影响力的研究工作。部分学者构建了结合符号执行与抽象解释的混合分析框架,显著提升了对环境类与交互类漏洞的检测精度。另有研究团队开发了基于深度学习的漏洞预测模型,通过嵌入字节码特征实现了对新型漏洞模式的早期预警。这些成果共同推动了智能合约形式化验证与机器学习检测技术的融合发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作