five

Awesome Smart Contract Datasets|智能合约数据集|区块链安全数据集

收藏
github2024-04-01 更新2024-05-31 收录
智能合约
区块链安全
下载链接:
https://github.com/acorn421/awesome-smart-contract-datasets
下载链接
链接失效反馈
资源简介:
一个精选的智能合约数据集列表,包含源代码、漏洞等。

A curated list of smart contract datasets, including source code, vulnerabilities, and more.
创建时间:
2023-07-01
原始信息汇总

数据集概述

数据集分类

仅包含代码的数据集

  • solidity-dataset - 该数据集收集自使用Solidity编程语言编写的公共GitHub仓库。
  • smart-contract-fiesta - Zellic公开的以太坊主网智能合约源代码数据集。
  • smartbugs-wild - 包含从以太坊网络提取的47,398个智能合约。

包含漏洞或错误的数据集

  • HuangGai - 以太坊智能合约漏洞注入框架,能注入20种漏洞到Solidity智能合约。
  • JiuZhou - 以太坊漏洞智能合约数据集。
  • ScrawlD - 真实世界以太坊智能合约标记有漏洞的数据集。
  • Smart-Contract-Benchmark-Suites - 评估智能合约测试最佳选择的实证研究。
  • Smart-Contract-Dataset - 用于评估智能合约安全分析工具的数据集。
  • VeriSmart-benchmarks - VeriSmart安全分析器用于以太坊智能合约的实验数据集。
  • DAppSCAN - 用于DApp项目智能合约弱点的规模化数据集构建。
  • smartbugs-curated - 精选的易受攻击Solidity智能合约数据集。
  • SmartScan-Dataset - 使用代码克隆检测技术识别智能合约中漏洞及其变体的数据集和实证分析结果。
  • ReentrancyStudy-Data - 包含230,548个开源智能合约的规模化重入漏洞数据集。
  • AFT2020/dataset - 用于机器学习实验的智能合约漏洞数据集(未验证)。
  • Web3Bugs - 提供智能合约中可利用漏洞资源的Web3开发者和安全分析师项目。
  • smart-contract-vulndb - 从各种审计报告中聚合的公开可用智能合约问题数据集。
  • Reviews - 智能合约漏洞数据集的综述。
  • reentrancy_solidity_function - 关于Solidity函数重入漏洞的数据集。
  • multi_class_solidity_function_vulnerabilty - 多类别Solidity函数漏洞数据集。
  • solidity-defi-vulnerabilities - 包含各种去中心化金融(DeFi)攻击场景和漏洞信息的数据集。
  • slither-audited-smart-contracts - 包含Solidity智能合约源代码和部署字节码的数据集,以及根据Slither静态分析框架的漏洞分类。
  • SolidiFI-benchmark - 用于评估Solidity智能合约分析工具的基准数据集。
  • A_benchmark_dataset_of_Solidity_smart_contracts - 包含4,364个真实世界Solidity智能合约的基准数据集,手动标记有十种漏洞类型。
  • Vulnerable_Verified_Smart_Contracts - 真实易受攻击的以太坊智能合约数据集。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Awesome Smart Contract Datasets 数据集的构建方式主要通过从公开的GitHub仓库、Ethereum网络以及其他公开资源中收集Solidity编程语言编写的智能合约源代码。这些数据集不仅包括了智能合约的源代码,还涵盖了与合约相关的漏洞和错误信息。通过自动化工具和人工标注相结合的方式,对收集到的合约进行分类和标注,确保数据集的多样性和实用性。
特点
该数据集的特点在于其广泛性和多样性,涵盖了从简单的合约代码到复杂的漏洞分析数据。数据集不仅包括了大量的智能合约源代码,还提供了详细的漏洞标注和分类,便于研究人员和开发者进行智能合约的安全性分析和测试。此外,数据集的更新频率较高,能够及时反映智能合约领域的最新动态。
使用方法
使用Awesome Smart Contract Datasets数据集时,用户可以根据需求选择不同的子数据集,如仅包含代码的数据集或包含漏洞信息的数据集。通过下载相应的数据集文件,用户可以进行智能合约的静态分析、漏洞检测、安全性评估等研究工作。数据集的多样性和详细标注使得其在智能合约安全领域的研究中具有广泛的应用价值。
背景与挑战
背景概述
智能合约作为区块链技术的重要组成部分,近年来在去中心化应用(DApps)和金融(DeFi)领域得到了广泛应用。然而,智能合约的安全性问题一直是学术界和工业界关注的焦点。Awesome Smart Contract Datasets数据集由多个研究机构和开发者共同维护,旨在为智能合约的安全分析、漏洞检测和代码优化提供丰富的数据资源。该数据集涵盖了从公开GitHub仓库中收集的Solidity编程语言代码,以及包含已知漏洞的智能合约样本,为研究人员提供了宝贵的实验材料。通过这些数据,研究者可以深入探索智能合约的安全性问题,推动相关领域的技术进步。
当前挑战
智能合约数据集的构建面临多重挑战。首先,智能合约的复杂性和多样性使得数据收集和标注过程异常繁琐,尤其是对漏洞的识别和分类需要高度专业化的知识。其次,智能合约的动态性和去中心化特性导致数据集的更新和维护成本较高,确保数据的时效性和准确性是一个持续的挑战。此外,智能合约的安全性问题涉及多种攻击类型,如重入攻击、时间操纵漏洞等,如何全面覆盖这些攻击场景并提供有效的检测工具是当前研究的重点和难点。
常用场景
经典使用场景
在智能合约领域,Awesome Smart Contract Datasets 数据集的经典使用场景主要集中在智能合约的安全性分析与漏洞检测。该数据集包含了大量已部署在以太坊网络上的智能合约源代码,以及这些合约中已知的漏洞和缺陷。研究者和开发者可以利用这些数据集进行智能合约的静态分析、漏洞检测工具的评估与优化,以及智能合约安全性的深入研究。
解决学术问题
该数据集解决了智能合约领域中常见的学术研究问题,如智能合约漏洞的自动检测、漏洞类型的分类与识别、以及智能合约安全性的评估。通过提供大规模的智能合约源代码和已知漏洞数据,研究者可以开发和验证新的漏洞检测算法,推动智能合约安全技术的发展。这对于提升区块链生态系统的安全性和可靠性具有重要意义。
衍生相关工作
基于Awesome Smart Contract Datasets,许多经典工作得以展开,包括智能合约漏洞检测工具的开发与评估、智能合约安全性的实证研究,以及智能合约漏洞数据库的构建。例如,研究者开发了多种静态分析工具,如Slither和SmartCheck,用于自动检测智能合约中的漏洞。此外,该数据集还支持了多个智能合约安全基准测试套件的构建,为智能合约安全研究提供了标准化的评估框架。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

VQA

我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。

OpenDataLab 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录