five

NoCode-bench_Verified

收藏
Hugging Face2025-08-03 更新2025-08-04 收录
下载链接:
https://huggingface.co/datasets/NoCode-bench/NoCode-bench_Verified
下载链接
链接失效反馈
官方服务:
资源简介:
NoCode-bench Verified数据集是NoCode-bench数据集的一个子集,用于自动评估系统的无代码功能添加能力。该数据集包含GitHub上各种PR的相关信息,包括功能补丁、测试文件补丁、文档更改等,以及与问题解决相关的测试结果。数据集主要是英文文本。
创建时间:
2025-07-29
原始信息汇总

NoCode-bench_Verified 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本生成
  • 标签: 代码
  • 数据规模: n<1K

数据集摘要

NoCode-bench_Verified 是 NoCode-bench_Full 的一个子集,用于自动测试系统的无代码功能添加能力。

语言

  • 数据集文本主要为英文,但未进行基于语言类型的过滤或清理。

数据结构

示例数据结构如下:

  • repo: (str) - GitHub 上的仓库所有者/名称标识符。
  • instance_id: (str) - 格式化的实例标识符,通常为 repo_owner__repo_name-PR-number。
  • html_url: (str) - 收集实例的 PR 网页 URL。
  • feature_patch: (str) - 由 PR 生成的黄金补丁(不包括测试相关代码),用于解决问题。
  • test_patch: (str) - 由解决方案 PR 贡献的测试文件补丁。
  • doc_changes: (list) - 特定 PR 中的文档更改。
  • version: (str) - 用于运行评估的安装版本。
  • base_commit: (str) - 表示应用解决方案 PR 之前仓库 HEAD 的提交哈希。
  • PASS2PASS: (str) - 表示在 PR 应用前后应通过的测试的 JSON 字符串列表。
  • FAIL2PASS: (str) - 表示由 PR 解决并与问题解决相关的测试集的 JSON 字符串列表。
  • augmentations: (dict) - 用于实现功能的实体名称集合。
  • mask_doc_diff: (list) - 特定 PR 中的文档更改,其中 PR 编号被屏蔽。
  • problem_statement: (str) - 包含 mask_doc_diffaugmentations 的主要输入。
搜集汇总
数据集介绍
main_image_url
构建方式
NoCode-bench_Verified数据集作为NoCode-bench全集的一个精选子集,其构建过程体现了对无代码功能添加能力的系统性测试需求。数据采集源自GitHub平台的开源项目,通过提取拉取请求(PR)中的关键元素构建样本,包括仓库标识、问题解决补丁、测试补丁及文档变更等结构化字段。每个数据实例严格保留原始PR的版本控制信息、基础提交哈希及测试用例状态转换记录,确保数据溯源的完整性和可复现性。
特点
该数据集的核心价值在于其多维度的无代码功能实现表征,不仅包含标准的问题描述与解决方案补丁,还创新性地整合了文档变更掩码版本和功能实现实体标注。数据字段设计兼顾机器学习任务需求与技术细节保留,如PASS2PASS和FAIL2PASS字段精确刻画测试用例状态迁移,problem_statement字段则融合了掩码文档差异与功能实体信息,为模型提供丰富的上下文理解素材。英文为主的文本内容未经刻意筛选,真实反映了开源社区的自然语言特征。
使用方法
研究者可利用该数据集构建端到端的无代码功能添加评估系统,通过解析feature_patch与test_patch的对应关系建立补丁生成模型。version和base_commit字段支持精确的版本控制环境搭建,而FAIL2PASS字段可作为模型性能的验证指标。对于文档辅助生成研究,mask_doc_diff与problem_statement的组合提供了文档变更预测的理想输入。建议采用分层抽样策略处理数据规模限制,并注意结合augmentations字段实现多任务学习。
背景与挑战
背景概述
NoCode-bench_Verified数据集作为NoCode-bench的一个精选子集,专注于评估系统在无需编写代码的情况下添加新功能的能力。该数据集由相关研究团队构建,旨在推动自动化编程辅助工具的发展,特别是在代码生成和功能增强领域。其核心研究问题围绕如何通过自然语言处理技术,理解并实现用户需求,进而自动生成或修改代码。这一数据集的推出,为研究社区提供了一个标准化测试平台,显著促进了智能编程助手和自动化软件开发工具的研究进展。
当前挑战
NoCode-bench_Verified数据集面临的主要挑战包括如何准确评估系统在无需编码环境下实现功能添加的能力,这涉及到对自然语言理解和代码生成技术的深度融合。构建过程中的挑战则体现在数据清洗和标注的复杂性上,特别是需要确保feature_patch和test_patch的准确性和一致性。此外,数据集中文档变更和问题陈述的多样性也对模型的泛化能力提出了更高要求。
常用场景
经典使用场景
在软件工程领域,NoCode-bench_Verified数据集被广泛用于评估系统在无需编写代码的情况下添加新功能的能力。该数据集通过提供具体的代码补丁、测试补丁和文档变更,为研究人员提供了一个标准化的测试平台,用于验证自动化代码生成和功能添加系统的性能。特别是在研究低代码或无代码开发平台时,该数据集能够模拟真实世界中的软件开发场景,帮助研究者深入理解系统在处理复杂任务时的表现。
解决学术问题
NoCode-bench_Verified数据集解决了自动化代码生成和功能添加领域中的多个关键问题。通过提供详细的代码补丁和测试用例,该数据集使研究者能够量化系统在功能添加任务中的准确性和效率。此外,数据集中的文档变更和问题描述为研究自然语言处理与代码生成的结合提供了宝贵资源,推动了跨领域研究的发展。其标准化结构也为不同系统的性能比较提供了统一基准。
衍生相关工作
围绕NoCode-bench_Verified数据集,学术界已衍生出多项重要研究。这些工作主要集中在自动化代码生成、低代码平台评估和软件工程自动化等领域。部分研究利用该数据集开发了新型的代码生成模型,另一些则专注于改进功能添加的评估指标。数据集的标准性也促使了多个基准测试框架的诞生,为后续研究提供了可复现的实验基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作