sanjuhs/cadforge-cadquery-agentic-traces

Name: sanjuhs/cadforge-cadquery-agentic-traces
Creator: sanjuhs
Published: 2026-04-25 15:14:22
License: 暂无描述

Hugging Face2026-04-25 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/sanjuhs/cadforge-cadquery-agentic-traces

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含用于CAD生成和RLVE/RLVR实验的agentic CadQuery修复轨迹。每个轨迹步骤包含：任务提示、之前的CadQuery代码、奖励JSON观察、下一个修正的CadQuery代码、奖励前后和奖励增量、以及源项目中的渲染/STL文件路径。数据集文件包括SFT格式的原始行、严格正行、推荐的SFT集、训练和验证分割、冷启动提示到CadQuery行、偏好对、RL滚动行、24个CAD任务、生成的资产和奖励设计报告。奖励组件结合了构建成功、拓扑、接触/间隙、任务语义、GLB/参考相似性、轮廓重叠、可编辑性和效率。预期用途包括在正CadQuery修复步骤上SFT一个小Qwen模型，评估CADForge环境中的构建率和奖励改进，运行GRPO/RLVE与实时验证器奖励，以及比较训练前后的Qwen 2B和Qwen 9B。

This dataset contains agentic CadQuery repair traces for CAD generation and RLVE/RLVR experiments. Each trace step has: task prompt, previous CadQuery code, reward JSON observation, next corrected CadQuery code, reward before/after and reward delta, artifact paths to renders/STLs in the source project. The dataset files include raw SFT-format rows, strict positive rows, recommended first SFT set, train and validation splits, cold-start prompt-to-CadQuery rows, chosen/rejected preference pairs, RL rollout rows, 24 CAD tasks, generated assets, and reward design reports. Rewards combine build success, topology, contact/gaps, task semantics, GLB/reference similarity, silhouette overlap, editability, and efficiency. Intended uses include SFT a small Qwen model on positive CadQuery repair steps, evaluate build rate and reward improvement in the CADForge environment, run GRPO/RLVE with live verifier rewards, and compare Qwen 2B and Qwen 9B before/after training.

提供机构：

sanjuhs

搜集汇总

数据集介绍

构建方式

CADForge CadQuery Agentic Traces数据集旨在服务于CAD生成与强化学习验证（RLVE/RLVR）实验，其构建过程依托于代理式轨迹修复机制。具体而言，每条轨迹步骤均包含任务提示、先前的CadQuery代码、奖励JSON观测结果、修正后的CadQuery代码、奖励前后变化及增量，以及关联的渲染图与STL文件路径。数据集通过采集智能体在CAD生成任务中的修复行为，形成结构化的序列数据，并依据奖励阈值（如reward_after≥0.60且正增量）进行严格筛选，划分出推荐的高质量子集用于下游任务。

特点

该数据集具备多层次、多场景的精细结构，涵盖了从原始修复轨迹到冷启动提示生成、偏好对、强化学习交互轨迹等多种数据形态。特别地，其奖励函数体系复合了构建成功率、拓扑正确性、接触与间隙分析、任务语义匹配、GLB/参考图像相似度、轮廓重叠度、可编辑性及效率等多个维度，确保了评估的全面性与鲁棒性。数据集规模虽小（n<1K），但通过精细的划分（如SFT、偏好学习、RL rollout子集）支持从监督微调到强化学习的完整训练流程。

使用方法

使用者可依据具体目标选择子数据集：首先，推荐使用data/sft/下的正向修复轨迹（如cadquery_agentic_sft_positive_060.jsonl）对小型Qwen模型进行监督微调（SFT）；随后，在CADForge环境中评估模型构建成功率与奖励提升，并利用data/preferences/cadquery_agentic_preferences.jsonl进行偏好对齐训练；最终，通过data/rl/cadquery_rollouts.jsonl配合实时验证器奖励开展GRPO/RLVE强化学习实验，对比Qwen 2B与9B模型在训练前后的性能差异。

背景与挑战

背景概述

CADForge CadQuery Agentic Traces数据集由研究团队于近期创建，旨在推动参数化三维模型代码生成与修复的智能化进程。该数据集聚焦于计算机辅助设计（CAD）领域中，如何通过强化学习与监督微调，使语言模型能够基于自然语言指令生成或修复CadQuery程序代码。其核心研究问题在于解决传统CAD建模过程繁琐、自动化程度低的困境，为智能设计自动化提供训练数据支撑。通过引入奖励机制与轨迹数据，该数据集为模型在三维几何推理与代码生成任务上的能力提升开辟了新路径，对CAD领域与人工智能的交叉研究具有重要影响力。

当前挑战

该数据集所应对的领域挑战主要在于三维CAD建模中代码生成的高复杂性与低容错性。CadQuery代码需要精确描述几何拓扑、约束关系及构件间的空间相互作用，任何微小语法或逻辑错误均会导致模型构建失败。在构建过程中，团队面临着如何设计综合奖励函数以准确评估修复结果质量的难题，奖励需涵盖构建成功率、拓扑合理性、接触间隙、任务语义匹配及编辑效率等多维指标。此外，数据规模有限（<1K），且需从少量专家轨迹中提取有效正负样本用于偏好学习，这对数据质量筛选与冷启动策略提出了严苛要求。

常用场景

经典使用场景

在生成式CAD（计算机辅助设计）与大型语言模型交叉的前沿领域，CADForge CadQuery Agentic Traces数据集为智能代码生成模型的训练与优化提供了关键性资源。该数据集最经典的使用场景在于利用其结构化的智能体修复轨迹（agentic repair traces），对预训练语言模型进行监督微调（SFT），使其掌握CadQuery代码的自动修复能力。具体而言，研究人员通过提取轨迹中任务提示、先前代码与修正后代码的对齐样本，训练模型在给定3D建模任务上下文时，能识别并纠正已有代码中的错误，从而逐步提升代码的准确性与可执行性。这一应用为后续强化学习阶段的策略优化奠定了坚实基础。

实际应用

在工业4.0与智慧制造加速落地的现实背景下，该数据集促进了基于语言模型的智能辅助设计工具的实用化进程。实际应用中，通过在该数据集上训练的模型能够集成至可计算设计环境，辅助工程师快速迭代零件模型：当用户通过自然语言描述一个三维零件（如‘带四孔的矩形底座’）并给出初始CadQuery代码后，模型可自动检测代码中的几何错误、参数偏差或装配逻辑缺陷，并生成修正方案。这一能力显著降低了专业CAD软件的使用门槛，使非专家用户也能借助对话式交互生成可制造的三维模型。同时，数据集中的RL rollout数据可用于部署在线学习系统，使模型在真实设计反馈中持续进化，适配不同行业的具体规范。

衍生相关工作

该数据集的出现催生了多项具有影响力的衍生研究工作。沿着其技术路线，研究者开发了用于三维代码生成的强化学习框架，结合GRPO（Group Relative Policy Optimization）算法与实时奖励验证器，在Qwen 2B和9B规模模型上验证了从SFT到RL的完整训练流程。另有工作将其生成的偏好对数据（chosen/rejected pairs）应用于基于人类反馈的强化学习（RLHF）方法，探索如何将制造约束与美学偏好融入奖励函数设计。此外，数据集附带的24个CAD任务及语义线索，为构建标准化的三维建模生成基准测试集提供了范本，推动了跨模型、跨框架的性能可比性研究。这些衍工作共同拓展了三维生成式AI从学术实验到工业落地的边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集