five

SWE-bench/SWE-bench_Verified

收藏
Hugging Face2026-02-27 更新2025-07-05 收录
下载链接:
https://hf-mirror.com/datasets/SWE-bench/SWE-bench_Verified
下载链接
链接失效反馈
官方服务:
资源简介:
SWE-bench Verified是一个包含500个样本的SWE-bench测试集的子集,这些样本已经过人工验证以确保质量。该数据集用于测试系统自动解决GitHub问题的能力,包含了来自流行Python仓库的500个测试性问题Issue-Pull Request对。数据集主要包含问题陈述和基准提交信息,用于在给定完整仓库和GitHub问题时进行问题解决任务的评估。

SWE-bench Verified is a subset of 500 samples from the SWE-bench test set, which have been human-validated for quality. It is used to test the ability of systems to automatically resolve GitHub issues, containing 500 test Issue-Pull Request pairs from popular Python repositories. The dataset primarily includes problem statements and base commits for evaluation in the issue resolution task given a full repository and GitHub issue.
提供机构:
SWE-bench
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作