five

Smart contract vulnerability dataset

收藏
github2023-07-01 更新2024-05-31 收录
下载链接:
https://github.com/AFT2020/dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含542个智能合约,这些合约是通过爬取coinmarketcap.com和etherscan.io网站提取的。数据集用于机器学习实验,每个合约记录包括名称、coinmarketcap链接、etherscan代币和合约链接、Solidity源代码、编译智能合约使用的编译器版本、重入攻击漏洞标签以及一个布尔值,用于标记合约是否用于实验。

This dataset comprises 542 smart contracts, which were extracted by crawling the websites coinmarketcap.com and etherscan.io. The dataset is intended for machine learning experiments, with each contract record including the name, coinmarketcap link, etherscan token and contract link, Solidity source code, the compiler version used to compile the smart contract, a label for reentrancy attack vulnerabilities, and a boolean value indicating whether the contract was used in the experiment.
创建时间:
2020-06-12
原始信息汇总

数据集概述

数据集名称

Smart contract vulnerability dataset

数据集内容

  • 包含542个智能合约的详细信息。
  • 数据来源:通过爬取coinmarketcap.com和etherscan.io网站获取。
  • 筛选标准:从coinmarketcap网站提取市场资本额最高的542个代币合约。

数据集详细信息

  • 每个智能合约记录包括:
    • 合约名称
    • coinmarketcap链接
    • etherscan代币和合约链接
    • 智能合约的Solidity源代码
    • 编译智能合约使用的编译器版本
    • 针对重入攻击的漏洞标签
    • 一个布尔值(ignored),标识该智能合约是否用于实验

数据集格式

  • 可通过SQLite数据库管理器如SQLiteStudio进行打开和编辑。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建过程始于对coinmarketcap.com和etherscan.io网站的爬取,旨在收集具有高市值的智能合约。研究团队从coinmarketcap.com提取了市值最高的542个代币合约,并通过这些合约在etherscan.io上的链接获取了相应的Solidity源代码。每个智能合约的记录包括合约名称、coinmarketcap链接、etherscan链接、Solidity源代码、编译器版本、重入攻击的漏洞标签以及一个用于标记是否在实验中使用的布尔值。
特点
该数据集包含了542个智能合约的详细信息,特别关注于重入攻击的漏洞标签,为研究智能合约安全性提供了丰富的实验材料。每个合约的Solidity源代码和编译器版本信息为深入分析合约的编译和执行环境提供了可能。此外,数据集通过SQLite数据库格式存储,便于使用SQLiteStudio等工具进行高效的数据管理和分析。
使用方法
数据集以SQLite数据库格式提供,用户可以通过SQLiteStudio等数据库管理工具直接打开和编辑数据。研究人员可以利用该数据集进行智能合约漏洞检测的机器学习实验,特别是针对重入攻击的研究。通过分析合约的Solidity源代码和编译器版本,用户可以深入理解智能合约的编译和执行机制,进而开发出更有效的漏洞检测算法。
背景与挑战
背景概述
智能合约漏洞数据集(Smart Contract Vulnerability Dataset)由研究人员在区块链技术快速发展的背景下创建,旨在为智能合约的安全分析提供数据支持。该数据集由542个智能合约组成,这些合约是从coinmarketcap.com和etherscan.io网站上爬取的,涵盖了市值最高的代币合约。每个合约记录包含了合约名称、相关链接、Solidity源代码、编译器版本以及针对重入攻击的漏洞标签。该数据集的创建为智能合约的漏洞检测和机器学习实验提供了重要的数据基础,推动了区块链安全领域的研究进展。
当前挑战
智能合约漏洞数据集在构建和应用过程中面临多重挑战。首先,智能合约的漏洞检测本身是一个复杂的问题,尤其是重入攻击等特定漏洞的识别需要高精度的分析和标注。其次,数据集的构建依赖于从公开网站爬取数据,这可能导致数据的不完整或过时,影响模型的训练效果。此外,智能合约的多样性和复杂性使得数据集的标准化和标注工作极具挑战性,如何确保数据的准确性和代表性仍需进一步研究。这些挑战不仅影响了数据集的构建质量,也对基于该数据集的机器学习模型的性能提出了更高的要求。
常用场景
经典使用场景
在区块链技术的研究领域,智能合约的安全性一直是学术界和工业界关注的焦点。该数据集通过提供542个智能合约的源代码及其相关漏洞标签,为研究人员提供了一个宝贵的资源,用于开发和测试机器学习模型以检测智能合约中的重入攻击漏洞。
实际应用
在实际应用中,该数据集被广泛用于金融机构和区块链开发公司,以增强其智能合约的安全审计流程。通过使用该数据集,这些机构能够更准确地识别合约中的安全漏洞,从而在部署前进行必要的修正,保障用户资产的安全。
衍生相关工作
基于该数据集,已经有多项研究成功开发了新型的智能合约漏洞检测工具和算法。这些工作不仅推动了智能合约安全领域的技术进步,也为后续的研究提供了理论基础和实践指导,促进了整个区块链生态系统的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作