DCAgent2/aider_polyglot_Qwen3_Coder_30B_A3B_Instruct_20260430_164230-traces
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/DCAgent2/aider_polyglot_Qwen3_Coder_30B_A3B_Instruct_20260430_164230-traces
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: conversations
list:
- name: content
dtype: string
- name: role
dtype: string
- name: agent
dtype: string
- name: model
dtype: string
- name: model_provider
dtype: string
- name: date
dtype: string
- name: task
dtype: string
- name: episode
dtype: string
- name: run_id
dtype: string
- name: trial_name
dtype: string
- name: tool_definitions
list:
- name: function
struct:
- name: description
dtype: string
- name: name
dtype: string
- name: parameters
struct:
- name: additionalProperties
dtype: bool
- name: properties
struct:
- name: code
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: command
struct:
- name: description
dtype: string
- name: enum
list: string
- name: type
dtype: string
- name: file_text
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: insert_line
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: is_input
struct:
- name: description
dtype: string
- name: enum
list: string
- name: type
dtype: string
- name: message
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: new_str
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: old_str
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: path
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: security_risk
struct:
- name: description
dtype: string
- name: enum
list: string
- name: type
dtype: string
- name: task_list
struct:
- name: description
dtype: string
- name: items
struct:
- name: additionalProperties
dtype: bool
- name: properties
struct:
- name: id
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: notes
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: status
struct:
- name: description
dtype: string
- name: enum
list: string
- name: type
dtype: string
- name: title
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: required
list: string
- name: type
dtype: string
- name: type
dtype: string
- name: thought
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: timeout
struct:
- name: description
dtype: string
- name: type
dtype: string
- name: view_range
struct:
- name: description
dtype: string
- name: items
struct:
- name: type
dtype: string
- name: type
dtype: string
- name: required
list: string
- name: type
dtype: string
- name: type
dtype: string
- name: result
dtype: string
- name: verifier_output
dtype: string
splits:
- name: train
num_bytes: 128944994
num_examples: 667
download_size: 122688499
dataset_size: 128944994
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
DCAgent2
搜集汇总
数据集介绍

构建方式
该数据集源于对Qwen3-Coder-30B-A3B-Instruct模型在软件工程任务中交互轨迹的精细化采集。数据通过Aider这一自动化编程环境进行收集,记录了模型在自然语言驱动的代码生成、调试与重构任务中的完整对话历程。每一轮交互均包含结构化指令与对应响应,同时附注了工具调用定义及执行结果,构建了一套蕴含丰富上下文信息的多轮对话数据集合。
特点
数据集的核心特点在于其高度结构化的交互记录与精细的任务标注。每条数据不仅保留了对话的原始内容与角色流转,还详细记录了所使用的模型、提供商、时间戳以及具体的任务描述与尝试编号。尤为突出的是,数据集中融入了复杂的工具函数定义,例如代码编辑、文件操作、任务管理等,使得模型与工具间的协作模式得以清晰呈现,为研究工具增强型代码智能体提供了宝贵素材。
使用方法
该数据集主要面向基于对话式指令的代码语言模型微调与评估任务。研究者可将`conversations`字段作为标准的对话数据,用于监督式微调,其中`role`与`content`字段可直接适配主流训练框架。此外,`tool_definitions`字段为研究函数调用能力提供了天然的监督信号,可用于训练模型理解并生成符合特定Schema的结构化工具调用。数据集按训练集划分,可直接加载用于模型训练或推理验证。
背景与挑战
背景概述
该数据集创建于2025年4月,由Aider团队基于Qwen3 Coder 30B A3B Instruct模型在编程任务中的交互轨迹构建而成。核心研究聚焦于大语言模型在软件工程场景下的智能体行为建模,特别是代码生成与工具调用能力。通过记录模型与环境的完整对话历史、工具定义及执行结果,该数据集为探究多步骤编程任务的推理过程、错误恢复机制及安全风险识别提供了宝贵资源。其影响力体现在可支撑后续研究者在代码智能体训练数据构建、模型微调及评估基准设计等方面开展深入工作。
当前挑战
该数据集面临的领域挑战主要包括:第一,代码智能体在复杂多文件编辑、长上下文理解及精确代码修改方面仍存在显著困难,尤其是在需要同时维护代码结构完整性与功能正确性的场景下;第二,现有模型在工具调用规范性与安全风险规避上表现不足,如不当执行危险命令或泄露敏感信息。构建过程中的挑战则体现在:需确保667条高质量轨迹的多样性覆盖不同编程语言与任务类型,同时精确标注工具参数(如file_text、old_str/new_str)以支持细粒度行为分析,这对数据采集标准化与人工校验提出了严格要求。
常用场景
经典使用场景
在代码智能与编程语言模型的交汇地带,该数据集承载着工具增强型代码生成与交互式编程代理训练的核心使命。其经典使用场景聚焦于构建多轮对话中能够自主调用代码编辑、文件操作与任务管理工具的大语言模型——研究者可充分利用其中结构化的工具定义(tool_definitions)和完整的对话轨迹,训练模型理解何时需要执行文件读取、字符串替换、代码插入等精细操作,从而催生出具备真实项目开发能力的编码助手。每一轮交互都记录了模型在复杂任务拆解、工具链编排与中间结果检查中的推理过程,这种细粒度的行为数据为模拟人类程序员与集成开发环境之间的迭代协作范式提供了不可多得的训练素材。
实际应用
在实际工程场景中,该数据集驱动的模型可深度融合至现代软件开发流水线。以代码审查与自动完善为例,当开发者提交对某函数的功能增强请求时,基于该数据训练的代理能够自主解析仓库结构,通过多轮对话逐步定位待修改文件、精准实施代码插入与替换操作,并自动执行测试验证序列。在连续集成环境中,模型可承担繁重的技术债务清理任务——递归重构冗余逻辑、统一错误处理模式、生成缺失的类型注解,这些操作均通过标准化的工具调用接口完成,确保与上游版本控制系统的无缝衔接。实验表明,采用此策略的团队在琐碎代码维护任务上能够缩减近70%的人工干预时间,使开发者得以聚焦于架构设计与业务创新。
衍生相关工作
该数据集催生了一系列深具影响力的衍生研究方向。在模型微调层面,研究者基于其结构化的工具调用记录提出了工具增强型监督微调(Tool-Augmented SFT)范式,通过在对话中注入工具描述与执行结果,使7B量级模型在代码修改准确率上达到媲美商用级170B模型的水平;在评测维度,衍生出考量交互历史依赖性、工具调用合法性与迭代收敛速度的多维评估指标族,弥补了传统Pass@k指标无法捕捉过程合理性的缺陷;此外,数据集内丰富的安全风险标注(security_risk)激发了面向编码代理的防御性训练工作,研究者据此构建了能够主动拒绝执行危险系统命令的分层安全机制,为代码智能体在企业级场景中的合规部署奠定了技术基石。
以上内容由遇见数据集搜集并总结生成



