SWE-bench_Lite

Hugging Face2025-03-20 更新2025-03-21 收录

下载链接：

https://huggingface.co/datasets/czlll/SWE-bench_Lite

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了代码库信息、实例ID、基础提交记录、补丁、测试补丁、问题描述、提示文本、创建时间、版本号以及两种转换状态（失败转成功和成功转成功）。此外，还包含了环境设置提交记录、编辑的函数序列和新增的函数序列。数据集分为测试集，共有274个示例。

This dataset includes code repository information, instance ID, base commit, patch, test patch, problem description, prompt text, creation time, version number, and two types of conversion status (failure-to-success and success-to-success). In addition, it also contains environment setup commit, edited function sequences, and newly added function sequences. This dataset is split into a test set, with a total of 274 instances.

创建时间：

2025-03-14

搜集汇总

数据集介绍

构建方式

SWE-bench_Lite数据集的构建基于软件工程领域的实际需求，通过收集和整理开源项目中的代码提交记录、测试补丁以及问题描述等信息。数据集中的每个实例均包含详细的元数据，如仓库名称、基础提交、补丁内容、测试补丁以及问题陈述等，确保了数据的全面性和可追溯性。构建过程中，特别关注了代码修改的功能性和测试用例的覆盖性，以支持软件缺陷修复和代码改进的研究。

特点

SWE-bench_Lite数据集的特点在于其丰富的上下文信息和结构化数据。每个实例不仅包含代码补丁和测试用例，还提供了问题描述和提示文本，便于研究者深入理解代码修改的背景和目的。此外，数据集还记录了环境设置提交和函数编辑信息，为分析代码变更的影响提供了多维度的支持。其测试集包含274个实例，覆盖了多种软件工程场景，具有较高的实用性和研究价值。

使用方法

使用SWE-bench_Lite数据集时，研究者可通过加载默认配置文件获取测试集数据。数据以JSON格式存储，包含多个字段，如`repo`、`instance_id`、`patch`等，便于直接用于代码修复、测试生成等任务。通过解析`FAIL_TO_PASS`和`PASS_TO_PASS`字段，可评估代码修改对测试结果的影响。此外，数据集支持与常见机器学习框架集成，为软件工程领域的自动化工具开发提供了高质量的训练和评估资源。

背景与挑战

背景概述

SWE-bench_Lite数据集是一个专注于软件工程领域的数据集，旨在通过提供代码库的变更历史、问题描述、测试补丁等信息，帮助研究人员和开发者更好地理解和解决软件维护中的问题。该数据集由多个开源项目的代码库构成，涵盖了从基础提交到补丁应用的完整流程。其核心研究问题在于如何通过自动化工具或模型来识别和修复代码中的缺陷，从而提高软件的质量和可维护性。该数据集的创建时间为近期，主要研究人员或机构尚未公开披露，但其对软件工程领域的自动化测试和代码修复研究具有重要的推动作用。

当前挑战

SWE-bench_Lite数据集面临的挑战主要包括两个方面。首先，在解决领域问题方面，如何有效地从代码库的变更历史中提取有用的信息，并生成能够准确修复代码缺陷的补丁，仍然是一个复杂且具有挑战性的任务。其次，在数据集的构建过程中，如何确保数据的多样性和代表性，以及如何处理不同项目之间的代码风格和结构差异，也是构建高质量数据集的关键挑战。此外，数据集中包含的测试补丁和问题描述的准确性和完整性，直接影响模型训练和评估的效果，因此数据质量的控制也是一个重要的挑战。

常用场景

经典使用场景

SWE-bench_Lite数据集主要用于软件工程领域的研究，特别是在代码修复和自动化测试生成方面。研究人员可以利用该数据集中的代码库、补丁和测试用例，模拟真实的软件开发环境，评估和比较不同代码修复算法的性能。

衍生相关工作

基于SWE-bench_Lite数据集，许多经典的研究工作得以展开。例如，研究人员开发了多种基于机器学习的代码修复算法，这些算法在代码修复的准确性和效率上取得了显著进展。此外，该数据集还催生了一系列关于测试用例生成和代码质量评估的研究，进一步推动了软件工程领域的发展。

数据集最近研究