five

R2E-Gym/R2E-Gym-Subset

收藏
Hugging Face2025-04-11 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/R2E-Gym/R2E-Gym-Subset
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集包含了代码仓库的详细信息,包括仓库的名称、使用的Docker镜像、提交的hash值、提交内容的解析、执行结果、修改的文件列表、修改实体摘要(包括类型、起始和结束行号、文件名、名称等)、相关文件、非测试文件的数目、非测试函数方法的数目、非测试代码行数、编程问题的描述、预期输出的JSON格式等。数据集分为训练集,提供了训练集的数据文件路径。总数据大小为3,665,788,272字节,下载大小为943,928,047字节。

This dataset includes detailed information about code repositories, such as repository name, Docker image used, commit hash, parsed commit content, execution result content, list of modified files, summary of modified entities (including type, start and end line numbers, file name, name, etc.), relevant files, number of non-test files, number of non-test functions or methods, number of non-test lines of code, description of programming problems, expected output in JSON format, etc. The dataset is split into a training set and provides the path to the data files for the training set. The total dataset size is 3,665,788,272 bytes, and the download size is 943,928,047 bytes.
提供机构:
R2E-Gym
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
R2E-Gym/R2E-Gym-Subset是一个软件工程领域的数据集,包含4,578行数据,以parquet格式存储,总大小为944 MB。数据集主要涵盖代码仓库提交、执行结果和问题描述等信息,用于支持代码生成或问题修复任务,并已被多个模型训练使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作