goal_gen_cases
收藏Hugging Face2026-04-26 更新2026-04-27 收录
下载链接:
https://huggingface.co/datasets/yianW/goal_gen_cases
下载链接
链接失效反馈官方服务:
资源简介:
Cases Demo 数据集是一个自包含的操作案例集合,用于目标图像处理流程。该数据集捆绑了场景渲染和物理精修代码,包含所有必要的网格、纹理和每个案例的参数,用于重现渲染结果和物理验证步骤。数据集包含8个主要案例,通过cases.json配置并通过run_case.py运行,同时附加了三个独立的数据包(mug_escape_v1、mug_escape_v3和cloth_hanger_hook)。数据集结构包括配置文件、运行脚本、共享场景资产(如桌子网格、墙壁纹理和HDR环境)以及每个案例的专用网格。数据集适用于计算机视觉和机器人操作任务,特别是涉及物理模拟和场景渲染的研究。使用该数据集需要Genesis物理模拟器及其他依赖(如trimesh、numpy等)。数据集详细描述了对象放置规则(包括自动计算位置和手动覆盖)、相机姿态保存方式以及运行时对Genesis的补丁修改。
创建时间:
2026-04-24
原始信息汇总
数据集概述:goal_gen_cases
基本信息
- 数据集地址:https://huggingface.co/datasets/yianW/goal_gen_cases
- 内容类型:包含8个操作案例的快照数据集,用于目标图像流水线的场景渲染和物理精炼验证
数据集结构
主要目录布局
cases.json:每个案例的配置文件(路径+参数)run_case.py:调度脚本,分发执行到具体脚本scripts/:包含四个脚本place_scene.py:Stage 1,Genesis光线追踪场景渲染refine_pose_physics.py:Stage 6,并行物理验证姿态verify_pose.py:用估计的姿态渲染场景genesis_patch.py:运行时补丁
assets/scene/:共享场景资源(table.glb,wall-basecolor.jpg,env.hdr)assets/cases/:每个案例的网格文件(目标、容器、碰撞对象)- 附加包:
mug_escape_v1/,mug_escape_v3/,cloth_hanger_hook/(各有自己的网格和清单)
8个案例详情
| 案例名称 | 类别 | 容器位置 | 容器欧拉角 | 备注 |
|---|---|---|---|---|
| mug_tree_goal | 桌面 | 自动计算 | (90, 0, 0) | 金属表面OBJ容器 |
| dish_rack | 桌面 | (0, 0, 1.1879) | (90, 0, 0) | 使用碰撞凸面OBJ |
| dish_rack_2 | 桌面 | (0, 0, 1.0839) | (90, 0, 90) | 使用预缩放的0.9×盘子GLB |
| tube_rack | 桌面 | 自动计算 | (90, 0, 90) | 使用碰撞凸面OBJ |
| scissor_rack | 桌面 | (0, 0, 0.9775) | (90, 0, 90) | 目标和容器UID分离 |
| wine_rack | 桌面 | (0, 0, 0.8473) | (90, 0, 90) | 使用碰撞凸面OBJ |
| wine_rack_2 | 桌面 | (0, 0, 1.0851) | (90, 0, 0) | 使用碰撞凸面OBJ |
| hanger_hooks | 墙面 | 自动(墙面安装) | (-180, 0, 90) | 墙面位置x=-0.5,墙面高度1.2 |
世界坐标系与物体放置
统一世界坐标系
- 桌子:
table_pos=(0, 0, 0.485403),table_euler=(90, 0, 90),桌面高度z=0.7451 - 8个主案例额外添加背景墙网格,墙位置
x=-0.345 cloth_hanger_hook:墙面安装,墙平面x=-0.45,wall_height=1.2
桌面物体放置
- 容器:
pos = (0, 0, 0.7451 − mesh_min_z),自动放置在桌面上 - 目标:
pos = (0, +y_offset, 0.7451 − mesh_min_z),沿+Y方向与容器并排,间距2cm - 相机:使用
find_best_camera()自动定位
墙面物体放置
- 容器:
pos = (wall_x − container_min_x, 0, wall_height) - 墙面默认值:
hanger_hooks的wall_x=-0.5,wall_height=1.2
渲染参数
- 渲染分辨率:1200×896
- 视场角:50°
- 采样数:1024 spp
- 所有8个案例共享相同的内参矩阵
数据集不包含的内容
- Stage 2–5(Gemini编辑、SAM3分割、Depth Pro深度、DINOv3姿态估计)——需要外部API密钥和大型预训练检查点
- 运动规划/MPC(Stage 7 + MPC插入流水线)
- 原始的输出目录(视频、掩码、候选姿态)
运行方法
- 环境要求:
genesis物理模拟器、trimesh,numpy,imageio,scipy,torch - 渲染命令:
python run_case.py --case <案例名> --stage render - 物理精炼命令:
python run_case.py --case <案例名> --stage refine - 验证命令:
python run_case.py --case <案例名> --stage verify - 输出目录:
cases_demo/outputs/<案例名>/
附录案例包
mug_escape_v1
- 4个杯架上的杯子案例(含逃逸路径)
mug_escape_v3
- 3个杯架v3上的杯子案例(仅精炼姿态)
cloth_hanger_hook
- 12个衣架×墙钩案例(精炼+逃逸路径)
搜集汇总
数据集介绍

构建方式
goal_gen_cases 数据集精心构建了8个用于目标图像管线的操作案例,每个案例均包含场景渲染与物理验证的完整代码、网格、纹理及专属参数。数据集的构建依托于 Genesis 物理模拟器,通过 place_scene.py 脚本实现物体在桌面或墙面场景中的自动放置:容器位置由其网格最小Z坐标与桌面高度(z=0.7451)自动推导,目标物体则沿Y轴紧邻容器并保留2厘米间距。相机通过 find_best_camera() 自适应定位,确保视场角50°、分辨率1200×896下以85%填充率涵盖目标与容器。为弥补视觉网格与预分解碰撞网格的边界差异,部分案例显式指定了容器位置覆盖。
使用方法
使用者可通过 run_case.py 脚本便捷操作,支持按案例或全量执行渲染、物理位姿精化及可视化验证三个阶段。输出结果按案例目录组织,包含渲染图像、深度图、分割掩码及精化后的位姿文件。脚本也可独立调用,需通过环境变量指定 HDR 与墙面纹理路径。数据集依赖 genesis、trimesh、numpy 等库,碰撞网格需以预分解凸包格式加载。使用者亦可参考每条案例的 cases.json 配置,自定义参数以适配新场景,但需注意 Stages 2-5(涉及外部API与大模型)及运动规划阶段未被包含在内。
背景与挑战
背景概述
该数据集由研究团队于近年创建,旨在解决机器人操作领域中具有挑战性的目标导向抓取与放置问题,特别是针对复杂家居场景下的物体精准操作。数据集涵盖了8种典型的操作案例,包括杯子架、碗架、管架、剪刀架、酒架以及挂钩等,涉及桌面与墙面两种安装方式。其核心研究问题在于如何通过物理仿真与视觉渲染的紧密结合,生成高质量的初始场景图像与物理验证后的物体位姿,从而为后续的视觉语言模型编辑、分割、深度估计与姿态估计等环节提供可靠的数据基础。研究人员通过精心设计的场景渲染脚本与并行的物理碰撞检测机制,确保了数据的一致性与可复现性。该数据集对机器人学习、仿真到现实迁移以及灵巧操作等领域具有重要的推动作用,为相关研究提供了一个标准化且可扩展的基准测试平台。
当前挑战
数据集所解决的领域问题在于机器人操作中的目标位姿估计与物理合理性验证,这要求生成的数据不仅视觉上逼真,更需满足几何与动力学的约束。构建过程中面临的主要挑战包括:首先,不同物体因其形状与尺寸差异,需要自动计算其在桌面或墙面上的精确放置位置,例如容器与目标的相对偏移必须考虑包围盒的交集以避免穿透。其次,物理仿真中视觉网格与碰撞网格的不一致性导致需要手动设定容器位置偏移,以弥合两者间的几何差异。此外,对于像碗架中盘子尺寸过大这样的特殊情况,必须对模型进行预缩放以避免完全碰撞,增加了数据处理复杂度。最后,将场景渲染脚本与物理验证脚本集成在单一流水线中,并处理好依赖路径与运行环境的一致性,也是工程实现上的显著挑战。
常用场景
经典使用场景
goal_gen_cases数据集在机器人操作与物体重排领域中扮演着至关重要的基准角色,专为评估和验证基于目标图像的物体操控流水线而设计。该数据集囊括了八种精细编排的操控案例,涵盖了诸如杯子置于杯架、碗碟归纳于碗架、剪刀插入剪刀架、酒瓶安放于酒架以及衣架悬挂于壁钩等典型家庭与工业场景。研究者可利用该数据集中的渲染脚本与物理参数,系统性地测试视觉感知、姿态估计与物理仿真之间的联动效果,尤其适用于验证物体从初始状态到目标状态的完整推理链条,为后续智能操作系统的开发奠定了坚实的实验基础。
解决学术问题
该数据集精准回应当前机器人学领域中物体操作泛化性不足与仿真环境真实度欠缺的核心困境。其通过提供完备的场景渲染、碰撞网格与物理验证脚本,有效解决了从单视图图像中估计物体精确姿态并将其稳固放置于指定容器内的学术挑战。研究者可借此深入研究视觉与物理之间的交叉验证机制,探索如何在包含复杂几何约束(如碗架间隙限制、壁钩悬挂稳定性)的条件下达成可靠的操控决策。这一范式的确立,推动了机器人操作从理想化仿真迈向更具现实意义的物理交互研究,其影响深远,为后续领域内关于鲁棒性与自适应性的理论突破提供了关键的数据支撑。
实际应用
在实际应用层面,goal_gen_cases数据集所涵盖的场景直接映射至智能家居服务、物流自动化以及精密装配等领域的核心需求。例如,家庭服务机器人可利用该数据集衍生的算法,学会将碗碟整齐放入洗碗架、将衣架稳妥挂上壁钩,从而大幅提升日常家务的自主完成度。在工业环境中,数据集所验证的物体姿态精炼与碰撞避免策略,可迁移至生产线上的工件拾取与安放任务,减少因定位误差导致的设备损坏与生产中断。这些应用不仅提升了机器人系统的操作精度与自适应能力,更为非结构化环境下的无人化作业提供了切实可行的技术路径,展现出从学术研究到产业落地的强大转化潜力。
数据集最近研究
最新研究方向
在机器人操作与物理仿真交汇的前沿,goal_gen_cases数据集正成为推动视觉引导抓取与精密物体摆放研究的核心驱动力。该数据集通过自包含的8个典型操作案例(涵盖桌面与墙面场景),结合Genesis物理引擎的高保真渲染与碰撞检测,为“目标图像驱动的机器人规划”提供了标准化基准。当前,研究者正利用其可复现的场景参数与物理验证管线,探索多模态感知融合(如深度与分割掩码)在非结构化环境中的鲁棒性,并围绕复杂接触任务(如挂钩悬挂、盘架插入)优化运动规划算法。该数据集的开放设计不仅降低了仿真到现实迁移的门槛,还通过解耦视觉与物理验证阶段,催生了关于端到端学习与模块化推理的深入讨论,其对推动灵巧操作领域的可重复性研究与产业化应用具有里程碑式的意义。
以上内容由遇见数据集搜集并总结生成



