five

智能合约升级行为数据集

收藏
arXiv2025-08-04 更新2025-08-06 收录
下载链接:
https://arxiv.org/pdf/2508.02145.pdf
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集由浙江大学的研究团队创建,旨在研究智能合约升级行为的安全性。数据集包含了83085个升级合约和20902个升级链,是目前为止关于升级行为的最大规模数据集。该数据集揭示了升级行为的多样性,并暴露了公开披露的不足。数据集的创建过程包括识别具有潜在升级行为的合约、分析合约的字节码以确定升级合约,以及监测DELEGATECALL目标的变化以检测实际的升级行为。数据集的应用领域主要涉及智能合约的安全性评估和风险管理,旨在解决智能合约升级过程中可能存在的安全风险问题。

This dataset was created by a research team from Zhejiang University to study the security of smart contract upgrade behaviors. It contains 83,085 upgraded contracts and 20,902 upgrade chains, making it the largest-scale dataset on upgrade behaviors to date. This dataset reveals the diversity of upgrade behaviors and exposes the deficiencies in public disclosure. The dataset construction process includes identifying contracts with potential upgrade behaviors, analyzing contract bytecode to determine upgraded contracts, and monitoring changes in DELEGATECALL targets to detect actual upgrade behaviors. Its main application fields involve smart contract security assessment and risk management, aiming to address potential security risks during the smart contract upgrade process.
提供机构:
浙江大学
创建时间:
2025-08-04
搜集汇总
数据集介绍
main_image_url
构建方式
智能合约升级行为数据集的构建采用了多阶段分析方法。首先,通过分析以太坊和BSC区块链上的交易轨迹,筛选出调用过DELEGATECALL指令的合约;其次,通过静态字节码分析确定目标地址来源于存储的可升级合约;最后,通过监控存储槽变化识别实际发生升级行为的合约。该方法确保了数据集的全面性和准确性,共包含83,085个升级合约和20,902条升级链。
特点
该数据集具有三个显著特征:规模性(首个大规模升级行为数据集)、多样性(涵盖196种不同的存储位置模式)和实证性(基于真实链上数据构建)。特别值得注意的是,数据集揭示了非代理升级模式的普遍存在(占70%),突破了传统研究仅关注代理模式的局限,为全面理解智能合约升级行为提供了新的视角。
使用方法
该数据集支持三类主要应用场景:安全分析(检测升级相关漏洞)、模式研究(分析不同升级策略的分布)和工具评估(验证升级识别工具的覆盖率)。研究人员可通过分析升级链时序特征研究升级频率,或结合字节码静态分析检测存储碰撞风险。数据集中的交易哈希和合约地址为后续的链上数据追溯提供了完整入口。
背景与挑战
背景概述
智能合约升级行为数据集由Dingding Wang、Jianting He、Siwei Wu、Yajin Zhou、Lei Wu和Cong Wang等研究人员于2025年构建,旨在全面研究智能合约升级行为的安全风险。该数据集包含83,085个升级合约和20,902条升级链,首次大规模揭示了升级行为的多样性和潜在安全漏洞。智能合约的不可变性是其核心特性之一,但升级机制的引入为修复漏洞和添加功能提供了灵活性,同时也带来了新的安全挑战。该数据集的发布填补了现有研究的空白,为智能合约安全领域提供了重要的实证基础,推动了相关安全工具和标准的发展。
当前挑战
智能合约升级行为数据集面临的挑战主要包括两个方面:领域问题挑战和构建过程挑战。在领域问题方面,升级机制破坏了合约的不可变性,可能导致恶意代码注入、存储冲突等安全风险,已有37起安全事件造成超过4亿美元损失。构建过程中的挑战包括:1)升级行为多样性导致现有工具难以准确识别非标准升级模式;2)升级过程不透明,区块链浏览器常无法完整显示真实逻辑;3)静态分析技术难以处理存储映射等复杂结构,影响数据集覆盖范围。此外,恶意升级行为的隐蔽性也为数据标注和验证带来困难。
常用场景
经典使用场景
智能合约升级行为数据集在区块链安全研究中扮演着关键角色,特别是在分析以太坊和币安智能链(BSC)上智能合约的升级行为及其潜在安全风险时。该数据集通过收集83,085个升级合约和20,902个升级链,为研究者提供了丰富的实证数据,用于揭示升级行为的多样性和潜在漏洞。
解决学术问题
该数据集解决了智能合约升级行为研究中的数据匮乏问题,填补了现有研究在非代理升级行为和安全风险分类上的空白。通过系统性地分析37个真实安全事件,数据集帮助研究者识别了八类升级风险,包括不当初始化、存储冲突和恶意代码注入等,为智能合约安全研究提供了全面的理论基础。
衍生相关工作
基于该数据集,衍生出多项经典研究工作,如升级风险分类框架的构建和智能合约安全分析工具的改进。相关研究进一步探索了代理与非代理升级模式的安全差异,并提出了针对存储冲突和接口冲突的缓解措施,推动了区块链安全领域的理论进展和实践创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作