Clean_SweBench

Hugging Face2025-05-31 更新2025-06-01 收录

下载链接：

https://huggingface.co/datasets/BoJavs/Clean_SweBench

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了软件开发中的补丁和应用相关信息，如补丁的描述、测试结果和环境设置等。数据集分为训练集和测试集，可用于机器学习模型的训练和评估。

创建时间：

2025-05-27

搜集汇总

数据集介绍

构建方式

在软件工程领域，Clean_SweBench数据集的构建过程体现了对代码修复任务的高度专业化处理。该数据集从真实世界的开源软件仓库中提取问题实例，每个实例均基于特定的基础提交版本，并包含详细的补丁文件和测试用例。通过精心筛选FAIL_TO_PASS和PASS_TO_PASS的测试场景，确保了数据覆盖代码修复前后的完整状态。环境设置提交和镜像名称的标注进一步保障了实验的可复现性，使得数据集在模拟实际开发环境时具有高度的真实性。

特点

Clean_SweBench数据集的特点在于其结构化的多维度信息整合。每个实例不仅提供了代码仓库和问题陈述的文本描述，还附带了具体的补丁内容与测试补丁，形成了从问题识别到解决方案的闭环数据流。独特的提示文本字段为模型提供了额外的上下文指导，而版本控制和时间戳信息则支持动态演化分析。数据集划分为训练集和测试集，规模分别为176和44个实例，这种适中的容量既保证了模型的充分学习，又便于快速验证算法性能。

使用方法

使用Clean_SweBench数据集时，研究人员可借助其丰富的元数据构建端到端的代码修复评估流程。通过加载指定分割的数据文件，能够直接访问问题陈述、补丁及测试用例等关键要素。环境设置提交与镜像名称可用于快速配置一致的实验环境，而FAIL_TO_PASS等测试指标则为量化模型性能提供标准基准。该数据集支持直接应用于自动化程序修复模型的训练与测试，其标准化格式便于集成到主流机器学习框架中进行分析。

背景与挑战

背景概述

Clean_SweBench数据集作为软件工程领域的重要资源，聚焦于自动化程序修复这一前沿研究方向。该数据集由专业研究团队构建，旨在通过真实世界中的代码变更实例，推动智能代码补全与错误修复技术的发展。其核心价值在于提供了从开源项目历史提交中提取的规范化数据，涵盖了代码补丁、测试用例及问题描述等关键要素，为构建可靠的代码生成模型奠定了数据基础。

当前挑战

该数据集首要挑战在于解决软件维护中自动化代码修复的复杂性，需准确理解自然语言描述与代码语义的映射关系。构建过程中面临多重困难：如何从海量提交记录中筛选具有教学价值的实例，确保代码补丁与测试用例的对应准确性，以及维护不同项目环境配置的一致性。这些挑战直接关系到模型在实际开发场景中的泛化能力与实用性。

常用场景

经典使用场景

在软件工程与自动化代码修复领域，Clean_SweBench数据集被广泛应用于评估智能代理在真实GitHub仓库中解决代码问题的能力。该数据集通过提供具体的代码库提交记录、问题描述及测试补丁，模拟了开发过程中常见的缺陷修复场景。研究人员利用该数据集训练模型理解代码变更需求，并生成符合测试要求的修复方案，从而推动自动化编程助手的发展。

衍生相关工作

基于该数据集衍生的经典研究包括结合强化学习的代码修复代理框架，以及针对跨仓库代码语义理解的预训练模型改进。这些工作进一步扩展了数据集的边界，例如通过引入多模态代码表示方法，或构建支持长上下文依赖的修复模型，为自动化软件工程领域提供了新的技术路径。

数据集最近研究