mehuldamani/bug-fixing-latent-demos-trial-v5
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/mehuldamani/bug-fixing-latent-demos-trial-v5
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: problem_id
dtype: string
- name: bug_id
dtype: int64
- name: problem
dtype: string
- name: buggy_code
dtype: string
- name: fixed_code
dtype: string
- name: language
dtype: string
- name: test_cases
dtype: string
- name: buggy_code_pass_rate
dtype: float64
- name: fixed_code_pass_rate
dtype: float64
- name: chosen_test_cases
dtype: string
- name: prompt
dtype: string
- name: demonstration
dtype: string
- name: latent_demonstration
dtype: string
splits:
- name: train
num_bytes: 179002
num_examples: 10
- name: test
num_bytes: 105165
num_examples: 10
download_size: 182536
dataset_size: 284167
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
提供机构:
mehuldamani
搜集汇总
数据集介绍

构建方式
该数据集是面向代码缺陷修复任务的精炼样本集合,其构建聚焦于从编程问题中系统性地提取有缺陷代码与修复后代码的配对实例。每一数据条目均包含唯一的问题标识符、缺陷编号、原始问题描述、有缺陷代码及其修复版本,并辅以编程语言标签与测试用例集合。通过计算修复前后代码在测试用例上的通过率,筛选出关键测试用例,进而生成用于引导大语言模型进行代码修复的提示与显式或隐式的示范样例。数据集划分为训练集与测试集,各含10条样本,数据总量约284KB,兼顾了小规模实验与快速迭代的需求。
特点
该数据集的核心特色在于其结构化的修复示范机制,不仅提供了标准的代码修复配对,还引入了显式示范与隐式示范两种形式,为研究代码修复中的少样本学习与模型引导策略提供了宝贵资源。每条样本均包含通过率指标,可量化评估修复效果。跨单个编程语言的数据设计使得研究更聚焦于修复策略本身。小型数据集规模(20条样本)便于快速验证算法假设,同时其多字段结构支持对提示工程、示范选择、测试用例生成等多维度研究。
使用方法
使用者可通过HuggingFace Datasets库直接加载该数据集,指定配置为'default'后按'train'和'test'拆分获取数据。每一数据条目可利用'problem'字段作为输入上下文,以'buggy_code'为待修复代码,参考'fixed_code'作为目标输出。通过'prompt'与'demonstration'字段可直接应用于少样本提示学习实验,而'latent_demonstration'为隐式示范变体,可用于对比不同示范策略对代码修复性能的影响。建议结合通过率指标对修复结果进行自动评估,并利用测试用例字段进行验证。
背景与挑战
背景概述
在软件工程领域,自动化缺陷修复一直是提升开发效率与代码质量的关键研究课题。近年来,大语言模型的兴起为程序修复带来了新的范式,但如何构建高质量的修复示例与提示工程仍是核心瓶颈之一。bug-fixing-latent-demos-trial-v5数据集由相关研究团队于近期创建,旨在探索利用潜在演示(latent demonstration)增强模型对代码缺陷的理解与修复能力。该数据集聚焦于编程竞赛或教育场景中的小型程序片段,每条样本包含缺陷代码、修复代码、测试用例及对应的模型提示与演示信息,为研究提示策略、少样本学习及代码修复效果的关联性提供了标准化评估资源。通过对10条训练与10条测试样本的精心标注,该数据集推动了从传统基于规则的修复向数据驱动的智能修复方法的过渡,对提升代码修复自动化水平具有重要参考价值。
当前挑战
当前数据集面临的核心挑战包括:第一,领域问题层面,自动化缺陷修复需应对代码逻辑的多样性与测试覆盖的不完备性,而该数据集仅包含少量样本,难以全面反映真实项目中复杂的错误模式与修复策略,限制了模型泛化能力。第二,构建过程中,数据采集需从大量编程竞赛解答中精准定位唯一的错误与修复对,并确保测试用例的充分性和通过率的计算准确性,这要求对代码语义与执行结果进行严格对齐,工艺流程复杂。此外,设计有效的潜在演示策略来辅助模型理解修复意图仍需深入探索,现有固定格式的演示可能无法适配多种错误类型,从而影响修复建议的实用性与可靠性。
常用场景
经典使用场景
在软件工程与程序语言研究领域,bug-fixing-latent-demos-trial-v5数据集为自动化程序修复与缺陷定位任务提供了宝贵资源。该数据集精心收录了多种编程语言中带有缺陷的代码片段及其对应的修复版本,并附带了测试用例与通过率指标,尤其涵盖了潜层示例(latent demonstration)这一特色字段。研究者可借助该数据集构建基于大语言模型的代码修复模型,通过对比错误代码与修复代码的差异,结合示例引导机制,提升模型对代码缺陷本质的捕捉能力。每一条数据都包含了完整的上下文信息,使得模型能够在多轮修复场景中保持一致性,为构建更为鲁棒的代码修复系统奠定了数据基础。
衍生相关工作
基于该数据集,研究者已衍生出多项经典工作,例如利用潜层示例增强的少样本代码修复模型,该模型通过将数据集中的demonstration字段作为提示模板,显著提升了在未见过的错误模式上的修复成功率。另一项代表性工作是结合测试用例排序的优先修复策略,利用fixed_code_pass_rate等指标动态调整修复候选的优先级。此外,数据集还催生了面向跨语言缺陷迁移学习的探索,研究者通过language字段构建语言无关的缺陷表征,实现了Java到Python等跨应用场景的修复知识复用。这些工作共同推动了智能程序修复从实验室走向工业级部署的进程。
数据集最近研究
最新研究方向
当前,代码智能与自动程序修复领域正迎来大语言模型驱动的新范式变革。bug-fixing-latent-demos-trial-v5数据集聚焦于通过隐式示例(latent demonstration)提升模型在代码缺陷定位与修复任务中的推理能力,其包含了问题描述、有缺陷代码、修复后代码及多维度测试用例通过率等结构化信息,为研究如何从错误模式中提炼可迁移的修复策略提供了稀缺的标注资源。该数据集的推出呼应了工业界对高质量代码自动化维护的迫切需求,尤其在持续集成与DevOps场景中,利用小样本学习与思维链提示来捕捉代码语义缺陷的深层表征,已成为前沿探索的焦点。其通过对比有缺陷与修复代码的测试通过率差异,为评估修复方案的鲁棒性建立了量化基准,有望推动从规则匹配到语义理解的代码修复技术跨越。
以上内容由遇见数据集搜集并总结生成



