mehuldamani/bug-fixing-latent-demos-trial-v4

Name: mehuldamani/bug-fixing-latent-demos-trial-v4
Creator: mehuldamani
Published: 2026-04-30 23:12:34
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/mehuldamani/bug-fixing-latent-demos-trial-v4

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: problem_id dtype: string - name: bug_id dtype: int64 - name: problem dtype: string - name: buggy_code dtype: string - name: fixed_code dtype: string - name: language dtype: string - name: test_cases dtype: string - name: buggy_code_pass_rate dtype: float64 - name: fixed_code_pass_rate dtype: float64 - name: chosen_test_cases dtype: string - name: prompt dtype: string - name: demonstration dtype: string - name: latent_demonstration dtype: string splits: - name: train num_bytes: 172710 num_examples: 10 - name: test num_bytes: 103624 num_examples: 10 download_size: 175853 dataset_size: 276334 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

提供机构：

mehuldamani

搜集汇总

数据集介绍

构建方式

该数据集聚焦于代码缺陷修复任务，基于多道编程问题的原始数据进行了精心的构建。每一道问题均包含一个唯一的problem_id，并进一步划分出具体的bug_id以标识不同版本的缺陷。数据集中为每个样本提供了有缺陷的代码片段（buggy_code）以及对应的修复代码（fixed_code），同时收集了这些代码在预设测试用例（test_cases）上的通过率（buggy_code_pass_rate与fixed_code_pass_rate），从而量化了代码的正确性水平。此外，还特别筛选了能够区分buggy与fixed代码的关键测试用例（chosen_test_cases），并基于原始问题生成了修复提示（prompt）与显式示范（demonstration），进一步通过潜在空间建模提取出隐式示范（latent_demonstration），丰富了模型的修复引导信息。整个构建过程确保了数据的高质量与任务导向性。

特点

该数据集的一大特色在于其多维度、结构化的信息组织方式。它涵盖了问题描述（problem）、编程语言（language）、缺陷代码与修复代码等多个关键属性，使研究人员能够从不同层面分析代码修复过程。尤为突出的是，数据集不仅记录了代码通过率这样的客观度量，还显式地给出了经过筛选的测试用例，这为评估修复效果提供了精确的基准。最具创新性的在于引入了隐式示范（latent_demonstration），它通过潜在表示捕捉了修复策略背后的隐含模式，为利用语义信息进行代码修复提供了新的视角。同时，训练集与测试集各包含10个精心平衡的样本，虽然规模精巧，但确保了任务的典型性与评估的可靠性。

使用方法

使用者可借助HuggingFace Datasets库便捷地加载该数据集，通过指定配置名称'default'以及分片路径（如'data/train-*'）即可获取训练与测试数据。加载后，每条样本包含从problem_id到latent_demonstration的丰富字段，适用于训练代码修复模型、评估修复准确率或进行示范学习研究。例如，研究人员可以构建模型，以prompt和demonstration为输入，预测fixed_code，并利用buggy_code_pass_rate与fixed_code_pass_rate来量化修复前后的正确率提升，同时结合chosen_test_cases进行细粒度的测试用例级别评估。该精巧的数据集尤其适合作为小样本场景下代码缺陷修复任务的验证基准。

背景与挑战

背景概述

在软件工程领域，自动化程序修复与代码缺陷检测是提升开发效率与代码质量的关键研究方向。bug-fixing-latent-demos-trial-v4数据集由研究机构构建，旨在探索利用潜在演示（latent demonstrations）驱动的代码修复方法。该数据集聚焦于多语言编程场景中的错误代码修复问题，记录了从问题描述、缺陷代码到修复后代码的完整对照，并引入了测试用例通过率等量化指标，为评估修复方案的有效性提供了标准化依据。其核心研究问题在于如何通过少量样本的潜在表示学习，提升代码修复模型的泛化能力与修复精度。该数据集的发布为语义级程序修复、少样本学习以及代码智能领域提供了宝贵的实验资源，推动了自动化代码修复技术从规则驱动向数据驱动范式的转变。

当前挑战

该数据集面临的挑战涵盖领域问题与构建过程两大方面。在领域问题上，代码缺陷修复任务的核心难点在于缺陷模式的多样性（如逻辑错误、边界条件遗漏）与修复策略的上下文依赖性，现有模型难以在复杂多语言场景中平衡修复准确性与代码语义一致性。构建过程中的挑战包括：如何从海量开源仓库中精准筛选语义明确的缺陷-修复对，避免噪声数据干扰模型学习；如何设计统一的测试用例评估标准，确保修复后代码的功能正确性；以及如何构建高质量的潜在演示样本，使模型能够从有限示例中提取可迁移的修复知识。此外，数据集规模仅20个样本，对模型在小样本场景下的泛化能力提出了更高要求。

常用场景

经典使用场景

在软件工程与程序语言研究领域，bug-fixing-latent-demos-trial-v4数据集为代码自动化修复模型的训练与评估提供了高质量的资源。该数据集包含配对的有缺陷代码与修复后代码，并附带了详细的测试用例及其通过率指标，使得研究者能够基于精确的语义信息探索程序修复的潜在模式。其经典使用场景聚焦于利用提示学习和潜在演示机制，构建能够从故障代码中准确推断修复方案的大型语言模型。通过引入潜变量表示的示范样本，该数据集特别适用于研究如何在不显式提供完整修复链的情况下，引导模型自主发现并应用正确的代码变换，从而推动少样本甚至零样本代码修复技术的发展。

实际应用

在实际软件维护与开发流程中，该数据集为构建智能化的代码缺陷自动修复工具奠定了数据基础。开发团队可利用其训练出的模型自动检测并修复版本迭代中引入的语法错误、逻辑漏洞或边界条件缺失，显著提升持续集成管线的效率。例如，在开源项目的代码审查环节，嵌入基于此数据集的修复引擎能够实时向开发者推荐补丁方案，减少人工排查时间。此外，数据集对代码通过率的细致标注使其能够应用于教学质量评估系统，辅助编程教育平台自动生成针对学生程序错误的修正建议，从而将学术界的前沿研究成果无缝转化为提升软件生产力和可靠性的实际生产力工具。

衍生相关工作

基于该数据集的结构化特性，研究者已衍生了多项具有影响力的经典工作。其中，潜在变量引导的代码修复方法被拓展至多语言编程助理系统，验证了跨语言修复迁移的有效性。另外，有工作利用本数据集中的测试用例覆盖度信息，首创了基于可修复性排序的样本筛选策略，显著提升了修复模型在大型代码库上的交互式调试效率。更为深入地，该数据集催生了关于演示质量对少样本修复效果影响的系统性研究，揭示了不同潜变量压缩策略对修复准确率的异质性效应。这些衍生工作共同构建了从数据收集、模型设计到部署优化的完整知识链条，在顶级软件工程会议如ICSE、ASE上形成了持续的研究脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集