five

zvzv1919/plain_gemini25flash-20t_prompterv2-200-400-healed

收藏
Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/zvzv1919/plain_gemini25flash-20t_prompterv2-200-400-healed
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit --- # plain_gemini25flash-20t_prompterv2-200-400-healed ## Summary | Metric | Value | | --- | --- | | Total instances | 200 | | File matches | 133 (66%) | | Function matches | 84 (42%) | | File mismatches | 67 | | No result | 0 | | Avg turns | 3.2 | ## Config ```yaml agent_func: locate agent_module: agents.locator.plain bench_name: plain_gemini25flash-20t_prompterv2-200-400-healed collection: zvzv1919/swe-lite-sympy-11400-69d146b3787b38cf81b3a888 dataset: zvzv1919/prompter_v2 limit: 200 max_turns: 20 max_workers: 50 model: gemini-2.5-flash offset: 200 repo_path: sympy__sympy-11400/sympy repo_path_prefix: /Users/xuan.zhao/Documents/GitHub-zv/ shuffle: false split: train ```
提供机构:
zvzv1919
搜集汇总
数据集介绍
main_image_url
构建方式
在软件工程领域,自动化代码定位任务对提升开发效率至关重要。该数据集基于SymPy数学库的特定版本,通过配置代理模块与定位函数,采用gemini-2.5-flash模型生成对话实例。构建过程中,从prompter_v2数据集中选取200个训练样本,并设定最大对话轮次为20,以确保交互深度与多样性,最终形成包含200个实例的标准化集合。
特点
本数据集专注于代码定位的对话交互,其核心特征体现在实例结构与质量指标上。数据集中平均对话轮次达到3.2,反映了多轮交互的复杂性;同时,文件匹配率为66%,函数匹配率为42%,这些量化指标为评估定位准确性提供了可靠依据。数据集配置明确,包含仓库路径、模型选择等元数据,确保了实验的可复现性与一致性。
使用方法
该数据集适用于训练或评估代码定位相关的对话系统与智能代理。研究人员可依据提供的配置参数,在指定代码仓库环境中复现数据生成流程,或直接利用现有实例进行模型测试。通过分析文件与函数匹配率等指标,能够系统评估模型在真实代码库中的定位性能,为软件工程自动化研究提供实证基础。
背景与挑战
背景概述
在软件工程与人工智能交叉领域,自动化代码修复与程序理解已成为提升开发效率的关键研究方向。数据集plain_gemini25flash-20t_prompterv2-200-400-healed由研究人员或机构zvzv1919于近期构建,其核心聚焦于利用大型语言模型进行代码定位任务,旨在评估模型在复杂代码库中精准识别与匹配相关函数及文件的能力。该数据集基于SymPy数学库的特定版本,通过模拟真实开发场景中的多轮对话交互,为代码智能代理的研发提供了重要基准,推动了自动化软件维护工具的技术演进。
当前挑战
该数据集致力于应对代码定位与理解中的核心挑战,即在庞大且结构复杂的代码库中,模型需准确解析自然语言查询并映射至具体代码实体,这要求模型具备深层次的语义推理与上下文关联能力。构建过程中,数据采集面临多重困难:确保多轮对话的连贯性与逻辑一致性,平衡文件匹配与函数匹配的样本分布,以及处理代码库版本差异带来的语义偏差,这些因素均对数据质量与评估效度构成显著影响。
常用场景
经典使用场景
在软件工程与代码智能领域,plain_gemini25flash-20t_prompterv2-200-400-healed数据集为代码定位与修复任务提供了关键支持。该数据集通过模拟真实开发环境中的多轮对话交互,专注于代码库中的文件与函数定位问题,其平均对话轮次达到3.2,体现了复杂问题求解的渐进过程。研究者利用这一数据集训练和评估智能代理在大型代码库中准确识别相关代码片段的能力,为自动化代码维护与理解奠定了数据基础。
实际应用
在实际软件开发流程中,该数据集支撑了智能代码助手与自动化调试工具的开发。基于其多轮对话结构,工具能够模拟开发者与代码库的交互,快速定位错误或功能相关的代码位置,从而加速代码审查与维护过程。例如,在开源项目如SymPy的维护中,此类数据集训练的代理可协助贡献者高效导航代码结构,减少人工搜索成本,提升团队协作效率,并促进持续集成环境中自动化测试与修复的集成。
衍生相关工作
围绕该数据集,衍生了一系列专注于代码定位与智能代理优化的经典研究。例如,基于类似配置的代理模块如agents.locator.plain被广泛应用于代码库分析任务,结合Gemini等大型语言模型,推动了代码搜索算法的改进。这些工作进一步扩展了数据集的用途,包括代码补全、缺陷预测及文档生成等方向,为软件工程自动化社区提供了可复现的实验框架与性能基准,促进了跨领域技术的融合与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作