Logic Bombs

Name: Logic Bombs
Creator: 中国香港中文大学深圳研究院和计算机科学与工程系
Published: 2018-05-25 20:26:32
License: 暂无描述

arXiv2018-05-25 更新2024-06-21 收录

下载链接：

https://github.com/hxuhack/logicbombs

下载链接

链接失效反馈

官方服务：

资源简介：

逻辑炸弹数据集是由中国香港中文大学深圳研究院和计算机科学与工程系的研究人员创建的，用于评估符号执行工具的能力。该数据集包含60个逻辑炸弹，每个炸弹都由特定的挑战性问题保护，旨在测试符号执行工具在处理如浮点数和符号内存等挑战时的性能。数据集创建过程中，研究人员精心设计了小型程序，确保每个逻辑炸弹都能准确反映特定的挑战。该数据集的应用领域主要集中在软件测试和程序分析，特别是在评估和改进符号执行工具的效率和准确性方面。

The Logic Bomb Dataset was created by researchers from the Shenzhen Institute of Research and Innovation and the Department of Computer Science and Engineering of The Chinese University of Hong Kong to evaluate the capabilities of symbolic execution tools. This dataset contains 60 logic bombs, each protected by a specific challenging problem, and is designed to test the performance of symbolic execution tools when handling challenges such as floating-point operations and symbolic memory. During the dataset creation process, researchers meticulously designed small-scale programs to ensure that each logic bomb accurately reflects a specific challenge. The application scenarios of this dataset mainly focus on software testing and program analysis, particularly in the evaluation and improvement of the efficiency and accuracy of symbolic execution tools.

提供机构：

中国香港中文大学深圳研究院和计算机科学与工程系

创建时间：

2017-12-05

搜集汇总

数据集介绍

构建方式

在符号执行技术评估领域，Logic Bombs数据集通过精巧设计的逻辑炸弹程序构建而成。研究团队首先系统梳理了符号执行面临的十二类挑战，包括符号推理挑战与路径爆炸挑战两大类。针对每类挑战，研究人员开发了多个小型C/C++程序，每个程序均嵌入特定逻辑炸弹——即仅当符号执行工具成功解决对应挑战性问题时才能触发的代码块。数据集包含超过60个逻辑炸弹案例，涵盖浮点数处理、符号内存、并行执行等复杂场景，并通过GitHub开源发布以确保可复现性。

特点

该数据集的核心特征在于其精细化的评估维度与高度可控的测试环境。每个逻辑炸弹程序均保持极简结构，仅聚焦单一挑战性问题，有效避免了现实程序中多因素耦合对评估结果的干扰。数据集设计了多层级难度梯度，例如在符号内存挑战中区分单层与多层数组访问，从而实现对工具能力的细粒度刻画。此外，程序间通过挑战传播关系形成有机网络，既能验证工具能力的一致性，又能揭示不同挑战间的内在关联，为符号执行工具的深度诊断提供了结构化视角。

使用方法

使用该数据集时需依托配套的自动化基准测试框架。框架首先对逻辑炸弹源码进行解析与编译，适配不同符号执行工具所需的中间表示或二进制格式。随后以批处理模式驱动目标工具对数据集进行符号执行，自动收集生成的测试用例。关键验证阶段通过重新执行测试用例确认逻辑炸弹触发状态，最终生成结构化评估报告。该方法支持对KLEE、Angr、Triton等主流工具的横向比较，典型评估可在数十分钟内完成，实现了效率与精度的平衡。

背景与挑战

背景概述

在软件测试与程序分析领域，符号执行技术已成为不可或缺的核心方法。随着KLEE、Angr等开源工具的涌现，如何系统评估其实际能力成为亟待解决的问题。为此，香港中文大学与复旦大学的研究团队于2018年提出了Logic Bombs数据集，旨在通过细粒度基准测试方法，精准衡量符号执行工具应对各类典型挑战的能力。该数据集通过系统梳理文献，归纳出符号推理与路径爆炸两大范畴共12类挑战，并设计了包含60余个逻辑炸弹的测试套件，为符号执行技术的评估提供了标准化、可复现的实证基础，显著推动了该领域测试方法论的发展。

当前挑战

Logic Bombs数据集致力于解决符号执行工具能力评估的基准测试难题，其核心挑战在于如何设计能够准确反映工具处理特定问题能力的测试用例。在构建过程中，研究团队面临双重挑战：一是技术层面需确保每个逻辑炸弹仅封装单一挑战问题，避免多因素干扰评估结果，例如在实现符号内存访问测试时，需精确控制数组层级结构以区分工具对不同复杂度问题的处理能力；二是工程层面需平衡测试的准确性与效率，既要通过微型程序结构规避路径爆炸导致的执行耗时问题，又要防止因过度简化而丧失现实代表性，例如在处理加密函数等复杂场景时，需设计既能触发目标行为又具备可执行性的测试边界。

常用场景

经典使用场景

在软件测试与程序分析领域，符号执行技术已成为不可或缺的核心工具。Logic Bombs数据集通过精心设计的逻辑炸弹程序，为评估符号执行工具在特定挑战性场景下的性能提供了标准化基准。这些逻辑炸弹模拟了符号执行过程中常见的复杂问题，如浮点数处理、符号内存访问和并行执行等，使得研究人员能够系统性地检验工具在应对各类符号推理与路径爆炸挑战时的实际表现。

衍生相关工作

Logic Bombs数据集催生了多维度研究脉络。在评估方法学层面，启发了基于微基准程序的符号执行能力量化范式；在工具优化方向，其揭示的缺陷（如Angr对二级数组支持的不足）直接推动了后续符号内存建模算法的改进；在安全研究领域，数据集衍生的挑战分类体系被广泛应用于代码混淆强度评估、混合执行策略设计等工作中。相关研究进一步拓展至并发程序符号执行、浮点约束求解等细分方向，形成了持续演进的技术生态。

数据集最近研究