five

princeton-nlp/SWE-bench_Lite_bm25_13K

收藏
Hugging Face2024-04-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/princeton-nlp/SWE-bench_Lite_bm25_13K
下载链接
链接失效反馈
官方服务:
资源简介:
SWE-bench Lite是SWE-bench的一个子集,用于测试系统自动解决GitHub问题的能力。该数据集收集了来自11个流行Python项目的300个测试Issue-Pull Request对。评估通过单元测试验证进行,使用PR后的行为作为参考解决方案。数据集还包括使用Pyserini的BM25检索格式化的每个实例,代码上下文大小限制为13,000个`cl100k_base`标记。数据集的主要用途是用于语言模型生成补丁文件,支持的任务是提供完整仓库和GitHub问题的解决方案。

SWE-bench Lite是SWE-bench的一个子集,用于测试系统自动解决GitHub问题的能力。该数据集收集了来自11个流行Python项目的300个测试Issue-Pull Request对。评估通过单元测试验证进行,使用PR后的行为作为参考解决方案。数据集还包括使用Pyserini的BM25检索格式化的每个实例,代码上下文大小限制为13,000个`cl100k_base`标记。数据集的主要用途是用于语言模型生成补丁文件,支持的任务是提供完整仓库和GitHub问题的解决方案。
提供机构:
princeton-nlp
原始信息汇总

数据集概述

数据集名称: SWE-bench Lite 数据集描述: SWE-bench Lite 是 SWE-bench 的一个子集,用于测试系统自动解决GitHub问题的能力。该数据集收集了来自11个流行Python项目的300个测试Issue-Pull Request对。评估通过单元测试验证进行,使用PR后的行为作为参考解决方案。

数据集特征

  • instance_id: 字符串类型
  • text: 字符串类型
  • repo: 字符串类型
  • base_commit: 字符串类型
  • problem_statement: 字符串类型
  • hints_text: 字符串类型
  • created_at: 字符串类型
  • patch: 字符串类型
  • test_patch: 字符串类型
  • version: 字符串类型
  • FAIL_TO_PASS: 字符串类型
  • PASS_TO_PASS: 字符串类型
  • environment_setup_commit: 字符串类型

数据集分割

  • dev: 23个示例,总大小1402179字节
  • test: 300个示例,总大小18207667字节

数据集大小

  • 下载大小: 8579282字节
  • 数据集总大小: 19609846字节

配置文件

  • config_name: default
  • data_files:
    • dev: data/dev-*
    • test: data/test-*

支持的任务和排行榜

  • 任务: 提供完整仓库和GitHub问题的Issue解决
  • 排行榜: www.swebench.com

语言

  • 主要语言: 英语
  • 处理: 未进行基于语言类型的过滤或清理
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作