five

SSR Dataset

收藏
arXiv2026-01-09 更新2026-01-13 收录
下载链接:
https://github.com/Zer0zw/SSR
下载链接
链接失效反馈
官方服务:
资源简介:
SSR数据集由中山大学等机构构建,包含15,992个开源DeFi质押智能合约的大规模集合,旨在分析质押逻辑缺陷的普遍性。数据来源于真实区块链项目,经安全事件和审计报告验证,其中3,557份合约(22.24%)被检测出存在至少一种逻辑缺陷。该数据集通过静态分析和LLM技术提取质押逻辑特征构建,重点解决DeFi领域因智能合约逻辑漏洞导致的经济损失问题,为安全审计和缺陷检测研究提供基准支持。
提供机构:
中山大学; 哈尔滨工业大学; 鹏城实验室
创建时间:
2026-01-09
原始信息汇总

SSR (Safeguarding Staking Rewards) 数据集概述

数据集简介

SSR 是一个用于检测 DeFi 质押合约中逻辑缺陷的工具。本仓库提供了与该工具相关的实证研究、实验数据集及实验结果。

数据集内容

数据集位于仓库的 Dataset 文件夹中,具体包含两部分:

  1. 基准真实数据集

    • 内容:与攻击事件及审计报告相关的 DeFi 质押合约源代码。
    • 用途:用于实证研究。
  2. 大规模数据集

    • 内容:来自不同区块链的 DeFi 质押合约源代码。
    • 涵盖区块链:Ethereum, BSC, Polygon, Avalanche, Arbitrum, Tron, Fantom, Celo。

相关资源

  • 实证研究结果:位于 Empirical 文件夹,包含与 DeFi 质押合约相关的攻击事件及审计报告。
  • 实验结果:位于 Experiment 文件夹,包含在基准真实数据集和大规模数据集上进行逻辑缺陷检测的结果,以及在基准真实数据集上运行 DeFi 质押模型的结果。
  • 工具源代码:位于 ssr 文件夹。
搜集汇总
数据集介绍
main_image_url
构建方式
在去中心化金融(DeFi)质押领域,逻辑缺陷的识别与防范是保障用户资产安全的关键。SSR数据集的构建基于对现实世界安全事件和审计报告的深入分析,通过系统性的实证研究方法,首先从多个区块链安全平台收集了64个安全事件和144份审计报告。研究团队采用开放式卡片分类法,由两名经验丰富的研究人员对事件和报告进行人工筛选与根因分析,最终定义了六类明确的逻辑缺陷类型。为确保数据集的真实性与代表性,研究者进一步从这些材料中提取并验证了40个DeFi质押智能合约,构成了一个经过人工标注的基础真值数据集,为后续检测工具的有效性评估提供了可靠基准。
特点
SSR数据集在DeFi安全研究领域展现出鲜明的特色。其核心价值在于首次系统性地定义并分类了DeFi质押合约中的六类逻辑缺陷,包括质押逻辑变量操纵、无时间延迟奖励、单一流动性池依赖等,每种缺陷均配有详细的描述与代码示例,为理解此类新型安全威胁提供了清晰的框架。数据集不仅包含小规模、高质量的基础真值集,还扩展了一个涵盖15,992个真实世界合约的大规模未标注数据集,揭示了高达22.24%的合约存在至少一种逻辑缺陷的普遍现象。这种“精标注”与“广覆盖”相结合的双层结构,使得该数据集既能用于精确的方法评估,也能支撑大规模的缺陷分布研究。
使用方法
该数据集为DeFi智能合约安全分析与工具开发提供了重要支撑。研究者可利用基础真值数据集,评估其逻辑缺陷检测工具或方法的精确度、召回率等性能指标。对于大规模数据集,可通过随机抽样与人工验证相结合的方式,调查特定类型逻辑缺陷在真实生态中的流行程度与分布规律。数据集支持静态分析、基于大语言模型的代码理解等多种研究范式。具体而言,用户可基于数据集中提供的合约源代码、缺陷分类及标注信息,训练或微调模型以识别复杂的质押逻辑模式,或开发类似SSR工具的、结合LLM与预定义规则的混合检测系统,从而推动DeFi质押合约的自动化安全审计实践。
背景与挑战
背景概述
SSR数据集是中山大学、哈尔滨工业大学及鹏城实验室的研究团队于2026年首次提出的,专注于去中心化金融(DeFi)质押场景中的逻辑缺陷检测。该数据集源于对64起安全事件和144份审计报告的实证分析,旨在解决DeFi质押智能合约中因逻辑错误导致的奖励操纵、重复领取等安全威胁。其构建标志着该领域首个系统性逻辑缺陷定义与检测研究的诞生,为后续智能合约安全分析提供了重要的基准数据与模型验证基础,显著提升了DeFi生态系统的安全审计能力。
当前挑战
SSR数据集面临的挑战主要体现在两大维度:在领域问题层面,其核心在于精准检测DeFi质押合约中复杂多变的业务逻辑缺陷,例如质押奖励变量操纵、缺乏时间延迟的奖励计算、单一流动性池依赖等六类缺陷,这些缺陷与传统智能合约漏洞(如重入攻击)在表现形式和根因上存在本质差异,难以通过预定义规则或通用分析工具有效识别。在构建过程中,挑战源于数据标注的高专业门槛,需从海量安全事件与审计报告中人工筛选并归因,同时需处理合约代码的多样性与复杂性,确保数据集的代表性、准确性与可扩展性。
常用场景
经典使用场景
在去中心化金融(DeFi)领域,质押机制作为提升锁仓总价值与激励用户参与的核心应用,其智能合约的安全性直接关系到巨额数字资产的安全。SSR数据集正是在这一背景下应运而生,它通过系统性地收集和分析DeFi质押合约中的逻辑缺陷,为安全审计与漏洞检测提供了关键的数据基础。该数据集最经典的使用场景是作为训练和评估智能合约静态分析工具(如SSR工具本身)的基准测试集。研究人员利用其中标注的六类逻辑缺陷实例,验证其检测模型在识别诸如质押逻辑变量操纵、无时间延迟奖励等漏洞时的精确度与召回率,从而推动自动化安全分析技术的发展。
解决学术问题
SSR数据集有效解决了DeFi安全研究中一个长期存在的关键问题:缺乏针对质押合约特有逻辑缺陷的系统性定义与标准化检测基准。传统智能合约漏洞检测工具往往聚焦于重入攻击、整数溢出等通用模式,难以捕捉与质押业务逻辑紧密耦合的复杂缺陷。该数据集通过对64起安全事件与144份审计报告的实证分析,首次明确定义了六类逻辑缺陷,并提供了详尽的代码示例与真实案例,为学术界建立了一套可复现、可验证的研究框架。其意义在于将DeFi质押安全从零散的案例分析提升至系统化的科学研究层面,为后续的漏洞分类、成因分析与自动化检测算法设计奠定了坚实的理论基础。
衍生相关工作
SSR数据集的构建与分析范式,启发了智能合约安全领域一系列相关研究。其将大语言模型(LLM)与静态分析相结合以理解复杂业务逻辑的方法,为检测其他领域特定缺陷(如借贷、去中心化交易所)提供了可借鉴的技术路径。基于类似的“实证分析-定义分类-构建模型-规则检测”框架,后续研究可以拓展至NFT合约缺陷、治理合约中心化风险等新兴安全问题。同时,该数据集公开的源代码与大规模合约集合,也为后续研究提供了宝贵的实验数据,促进了DeFi安全研究社区的协作与知识积累。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作