mehuldamani/bug-fixing-latent-demos-trial-v5

Name: mehuldamani/bug-fixing-latent-demos-trial-v5
Creator: mehuldamani
Published: 2026-04-30 23:17:16
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/mehuldamani/bug-fixing-latent-demos-trial-v5

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: problem_id dtype: string - name: bug_id dtype: int64 - name: problem dtype: string - name: buggy_code dtype: string - name: fixed_code dtype: string - name: language dtype: string - name: test_cases dtype: string - name: buggy_code_pass_rate dtype: float64 - name: fixed_code_pass_rate dtype: float64 - name: chosen_test_cases dtype: string - name: prompt dtype: string - name: demonstration dtype: string - name: latent_demonstration dtype: string splits: - name: train num_bytes: 179002 num_examples: 10 - name: test num_bytes: 105165 num_examples: 10 download_size: 182536 dataset_size: 284167 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

提供机构：

mehuldamani

搜集汇总

数据集介绍

构建方式

该数据集是面向代码缺陷修复任务的精炼样本集合，其构建聚焦于从编程问题中系统性地提取有缺陷代码与修复后代码的配对实例。每一数据条目均包含唯一的问题标识符、缺陷编号、原始问题描述、有缺陷代码及其修复版本，并辅以编程语言标签与测试用例集合。通过计算修复前后代码在测试用例上的通过率，筛选出关键测试用例，进而生成用于引导大语言模型进行代码修复的提示与显式或隐式的示范样例。数据集划分为训练集与测试集，各含10条样本，数据总量约284KB，兼顾了小规模实验与快速迭代的需求。

特点

该数据集的核心特色在于其结构化的修复示范机制，不仅提供了标准的代码修复配对，还引入了显式示范与隐式示范两种形式，为研究代码修复中的少样本学习与模型引导策略提供了宝贵资源。每条样本均包含通过率指标，可量化评估修复效果。跨单个编程语言的数据设计使得研究更聚焦于修复策略本身。小型数据集规模（20条样本）便于快速验证算法假设，同时其多字段结构支持对提示工程、示范选择、测试用例生成等多维度研究。

使用方法

使用者可通过HuggingFace Datasets库直接加载该数据集，指定配置为'default'后按'train'和'test'拆分获取数据。每一数据条目可利用'problem'字段作为输入上下文，以'buggy_code'为待修复代码，参考'fixed_code'作为目标输出。通过'prompt'与'demonstration'字段可直接应用于少样本提示学习实验，而'latent_demonstration'为隐式示范变体，可用于对比不同示范策略对代码修复性能的影响。建议结合通过率指标对修复结果进行自动评估，并利用测试用例字段进行验证。

背景与挑战

背景概述

在软件工程领域，自动化缺陷修复一直是提升开发效率与代码质量的关键研究课题。近年来，大语言模型的兴起为程序修复带来了新的范式，但如何构建高质量的修复示例与提示工程仍是核心瓶颈之一。bug-fixing-latent-demos-trial-v5数据集由相关研究团队于近期创建，旨在探索利用潜在演示（latent demonstration）增强模型对代码缺陷的理解与修复能力。该数据集聚焦于编程竞赛或教育场景中的小型程序片段，每条样本包含缺陷代码、修复代码、测试用例及对应的模型提示与演示信息，为研究提示策略、少样本学习及代码修复效果的关联性提供了标准化评估资源。通过对10条训练与10条测试样本的精心标注，该数据集推动了从传统基于规则的修复向数据驱动的智能修复方法的过渡，对提升代码修复自动化水平具有重要参考价值。

当前挑战

当前数据集面临的核心挑战包括：第一，领域问题层面，自动化缺陷修复需应对代码逻辑的多样性与测试覆盖的不完备性，而该数据集仅包含少量样本，难以全面反映真实项目中复杂的错误模式与修复策略，限制了模型泛化能力。第二，构建过程中，数据采集需从大量编程竞赛解答中精准定位唯一的错误与修复对，并确保测试用例的充分性和通过率的计算准确性，这要求对代码语义与执行结果进行严格对齐，工艺流程复杂。此外，设计有效的潜在演示策略来辅助模型理解修复意图仍需深入探索，现有固定格式的演示可能无法适配多种错误类型，从而影响修复建议的实用性与可靠性。

常用场景

经典使用场景

在软件工程与程序语言研究领域，bug-fixing-latent-demos-trial-v5数据集为自动化程序修复与缺陷定位任务提供了宝贵资源。该数据集精心收录了多种编程语言中带有缺陷的代码片段及其对应的修复版本，并附带了测试用例与通过率指标，尤其涵盖了潜层示例（latent demonstration）这一特色字段。研究者可借助该数据集构建基于大语言模型的代码修复模型，通过对比错误代码与修复代码的差异，结合示例引导机制，提升模型对代码缺陷本质的捕捉能力。每一条数据都包含了完整的上下文信息，使得模型能够在多轮修复场景中保持一致性，为构建更为鲁棒的代码修复系统奠定了数据基础。

衍生相关工作

基于该数据集，研究者已衍生出多项经典工作，例如利用潜层示例增强的少样本代码修复模型，该模型通过将数据集中的demonstration字段作为提示模板，显著提升了在未见过的错误模式上的修复成功率。另一项代表性工作是结合测试用例排序的优先修复策略，利用fixed_code_pass_rate等指标动态调整修复候选的优先级。此外，数据集还催生了面向跨语言缺陷迁移学习的探索，研究者通过language字段构建语言无关的缺陷表征，实现了Java到Python等跨应用场景的修复知识复用。这些工作共同推动了智能程序修复从实验室走向工业级部署的进程。

数据集最近研究