packages_python_filtered
收藏Hugging Face2026-04-08 更新2026-04-09 收录
下载链接:
https://huggingface.co/datasets/TIGER-Lab/packages_python_filtered
下载链接
链接失效反馈官方服务:
资源简介:
SWE-Next 是一个为代理(Agents)设计的可扩展的实时软件工程任务数据集。该数据集旨在支持软件工程领域的任务,特别是那些需要代理参与的实时任务。数据集的相关资源包括论文、项目页面、代码仓库、HuggingFace 上的数据集链接以及相关的 7B 和 14B 模型。该数据集适用于软件工程任务的研究和开发,特别是那些涉及代理的实时任务。
提供机构:
TIGER-Lab
创建时间:
2026-04-03
搜集汇总
数据集介绍

构建方式
在软件工程智能化发展的背景下,SWE-Next数据集的构建体现了对真实世界任务可扩展性的追求。该数据集通过系统性地收集和筛选来自开源软件仓库的实际工程问题,特别是聚焦于Python软件包的维护与更新场景,形成了一套经过过滤的高质量任务集合。其构建过程强调任务的代表性与复杂性,旨在为智能体训练提供贴近现实开发环境的挑战。
特点
作为面向智能体训练的软件工程数据集,SWE-Next的核心特点在于其任务来源的真实性与规模的扩展性。数据集涵盖了软件维护中的多样化操作,如依赖管理、错误修复和功能增强,这些任务均源自真实的开源项目演变历史。其经过过滤的版本确保了任务描述的清晰性和可执行性,为评估和提升智能体在复杂、动态的软件环境中的问题解决能力提供了坚实基础。
使用方法
该数据集主要应用于训练和评估能够处理软件工程任务的智能体模型。研究人员或开发者可通过HuggingFace平台直接加载数据集,将其中的任务实例作为智能体的输入,以监督学习或强化学习等方式进行模型微调。数据集的结构化设计支持对智能体在代码理解、修改决策和验证等一系列软件工程子任务上的性能进行系统性评测,推动自动化软件工程工具的发展。
背景与挑战
背景概述
在人工智能与软件工程交叉领域,自动化代码生成与任务执行已成为前沿研究方向。SWE-Next数据集由TIGER-AI实验室于2026年发布,其核心研究问题聚焦于为智能体构建可扩展的真实世界软件工程任务。该数据集旨在推动智能体在复杂、动态的软件开发环境中进行代码理解、修改与集成,从而弥合传统基准测试与实际工程需求之间的鸿沟。通过提供大规模、多样化的任务轨迹,SWE-Next为评估和训练软件工程智能体奠定了重要基础,对自动化编程、智能代码助手及自主软件开发系统的演进产生了深远影响。
当前挑战
该数据集致力于解决软件工程智能体在真实场景中执行复杂任务时所面临的挑战,例如代码库的长期依赖管理、多文件协同修改以及动态环境适应性问题。构建过程中的主要挑战在于如何从开源生态中筛选并重构具有代表性的工程任务,确保任务既具备足够的复杂性以反映现实需求,又保持结构化的可评估性。同时,数据收集需平衡任务多样性、规模与质量,并设计合理的轨迹标注机制以捕捉完整的解决过程,这对数据集的可靠性与实用性提出了较高要求。
常用场景
经典使用场景
在软件工程与人工智能交叉领域,SWE-Next数据集为智能体提供了大规模、真实世界的编程任务环境。其经典使用场景集中于训练和评估代码生成与软件维护智能体,通过模拟实际开发流程中的复杂问题,如代码修复、功能实现和系统重构,使模型能够学习从自然语言描述到可执行代码的映射,并处理多步骤、交互式的编程挑战。这一场景不仅推动了自动化编程工具的发展,也为智能体在动态软件环境中的适应性研究奠定了数据基础。
解决学术问题
该数据集有效解决了软件工程智能体研究中长期存在的规模与真实性不足的学术问题。传统基准往往局限于简单、孤立的代码片段,而SWE-Next通过集成数千个真实Python包中的过滤任务,提供了高度可扩展且贴近工业实践的场景。这使研究者能够深入探索智能体在复杂依赖管理、错误调试及长期任务规划中的能力,显著提升了评估的生态效度,并为软件自动化、智能编程助手等方向提供了可靠的实验平台。
衍生相关工作
围绕SWE-Next数据集,已衍生出一系列经典研究工作,包括基于其训练的SWE-Next-7B和SWE-Next-14B等专用模型。这些模型在代码生成与修复任务中展现了卓越性能,进一步催生了针对软件工程智能体的微调策略、轨迹学习框架以及多智能体协作方法的创新。同时,该数据集也促进了与GitHub等开源平台的集成研究,为构建端到端的自动化软件开发生态系统提供了关键支撑。
以上内容由遇见数据集搜集并总结生成



