goal_gen_cases

Hugging Face2026-04-26 更新2026-04-27 收录

下载链接：

https://huggingface.co/datasets/yianW/goal_gen_cases

下载链接

链接失效反馈

官方服务：

资源简介：

Cases Demo 数据集是一个自包含的操作案例集合，用于目标图像处理流程。该数据集捆绑了场景渲染和物理精修代码，包含所有必要的网格、纹理和每个案例的参数，用于重现渲染结果和物理验证步骤。数据集包含8个主要案例，通过cases.json配置并通过run_case.py运行，同时附加了三个独立的数据包（mug_escape_v1、mug_escape_v3和cloth_hanger_hook）。数据集结构包括配置文件、运行脚本、共享场景资产（如桌子网格、墙壁纹理和HDR环境）以及每个案例的专用网格。数据集适用于计算机视觉和机器人操作任务，特别是涉及物理模拟和场景渲染的研究。使用该数据集需要Genesis物理模拟器及其他依赖（如trimesh、numpy等）。数据集详细描述了对象放置规则（包括自动计算位置和手动覆盖）、相机姿态保存方式以及运行时对Genesis的补丁修改。

创建时间：

2026-04-24

原始信息汇总

数据集概述：goal_gen_cases

基本信息

数据集地址：https://huggingface.co/datasets/yianW/goal_gen_cases
内容类型：包含8个操作案例的快照数据集，用于目标图像流水线的场景渲染和物理精炼验证

数据集结构

主要目录布局

cases.json：每个案例的配置文件（路径+参数）
run_case.py：调度脚本，分发执行到具体脚本
scripts/：包含四个脚本
- place_scene.py：Stage 1，Genesis光线追踪场景渲染
- refine_pose_physics.py：Stage 6，并行物理验证姿态
- verify_pose.py：用估计的姿态渲染场景
- genesis_patch.py：运行时补丁
assets/scene/：共享场景资源（table.glb, wall-basecolor.jpg, env.hdr）
assets/cases/：每个案例的网格文件（目标、容器、碰撞对象）
附加包：mug_escape_v1/, mug_escape_v3/, cloth_hanger_hook/（各有自己的网格和清单）

8个案例详情

案例名称	类别	容器位置	容器欧拉角	备注
mug_tree_goal	桌面	自动计算	(90, 0, 0)	金属表面OBJ容器
dish_rack	桌面	(0, 0, 1.1879)	(90, 0, 0)	使用碰撞凸面OBJ
dish_rack_2	桌面	(0, 0, 1.0839)	(90, 0, 90)	使用预缩放的0.9×盘子GLB
tube_rack	桌面	自动计算	(90, 0, 90)	使用碰撞凸面OBJ
scissor_rack	桌面	(0, 0, 0.9775)	(90, 0, 90)	目标和容器UID分离
wine_rack	桌面	(0, 0, 0.8473)	(90, 0, 90)	使用碰撞凸面OBJ
wine_rack_2	桌面	(0, 0, 1.0851)	(90, 0, 0)	使用碰撞凸面OBJ
hanger_hooks	墙面	自动（墙面安装）	(-180, 0, 90)	墙面位置x=-0.5，墙面高度1.2

世界坐标系与物体放置

统一世界坐标系

桌子：table_pos=(0, 0, 0.485403)，table_euler=(90, 0, 90)，桌面高度 z=0.7451
8个主案例额外添加背景墙网格，墙位置 x=-0.345
cloth_hanger_hook：墙面安装，墙平面 x=-0.45，wall_height=1.2

桌面物体放置

容器：pos = (0, 0, 0.7451 − mesh_min_z)，自动放置在桌面上
目标：pos = (0, +y_offset, 0.7451 − mesh_min_z)，沿+Y方向与容器并排，间距2cm
相机：使用 find_best_camera() 自动定位

墙面物体放置

容器：pos = (wall_x − container_min_x, 0, wall_height)
墙面默认值：hanger_hooks 的 wall_x=-0.5，wall_height=1.2

渲染参数

渲染分辨率：1200×896
视场角：50°
采样数：1024 spp
所有8个案例共享相同的内参矩阵

数据集不包含的内容

Stage 2–5（Gemini编辑、SAM3分割、Depth Pro深度、DINOv3姿态估计）——需要外部API密钥和大型预训练检查点
运动规划/MPC（Stage 7 + MPC插入流水线）
原始的输出目录（视频、掩码、候选姿态）

运行方法

环境要求：genesis 物理模拟器、trimesh, numpy, imageio, scipy, torch
渲染命令：python run_case.py --case <案例名> --stage render
物理精炼命令：python run_case.py --case <案例名> --stage refine
验证命令：python run_case.py --case <案例名> --stage verify
输出目录：cases_demo/outputs/<案例名>/

附录案例包

mug_escape_v1

4个杯架上的杯子案例（含逃逸路径）

mug_escape_v3

3个杯架v3上的杯子案例（仅精炼姿态）

cloth_hanger_hook

12个衣架×墙钩案例（精炼+逃逸路径）

搜集汇总

数据集介绍

构建方式

goal_gen_cases 数据集精心构建了8个用于目标图像管线的操作案例，每个案例均包含场景渲染与物理验证的完整代码、网格、纹理及专属参数。数据集的构建依托于 Genesis 物理模拟器，通过 place_scene.py 脚本实现物体在桌面或墙面场景中的自动放置：容器位置由其网格最小Z坐标与桌面高度（z=0.7451）自动推导，目标物体则沿Y轴紧邻容器并保留2厘米间距。相机通过 find_best_camera() 自适应定位，确保视场角50°、分辨率1200×896下以85%填充率涵盖目标与容器。为弥补视觉网格与预分解碰撞网格的边界差异，部分案例显式指定了容器位置覆盖。

使用方法

使用者可通过 run_case.py 脚本便捷操作，支持按案例或全量执行渲染、物理位姿精化及可视化验证三个阶段。输出结果按案例目录组织，包含渲染图像、深度图、分割掩码及精化后的位姿文件。脚本也可独立调用，需通过环境变量指定 HDR 与墙面纹理路径。数据集依赖 genesis、trimesh、numpy 等库，碰撞网格需以预分解凸包格式加载。使用者亦可参考每条案例的 cases.json 配置，自定义参数以适配新场景，但需注意 Stages 2-5（涉及外部API与大模型）及运动规划阶段未被包含在内。

背景与挑战

背景概述

该数据集由研究团队于近年创建，旨在解决机器人操作领域中具有挑战性的目标导向抓取与放置问题，特别是针对复杂家居场景下的物体精准操作。数据集涵盖了8种典型的操作案例，包括杯子架、碗架、管架、剪刀架、酒架以及挂钩等，涉及桌面与墙面两种安装方式。其核心研究问题在于如何通过物理仿真与视觉渲染的紧密结合，生成高质量的初始场景图像与物理验证后的物体位姿，从而为后续的视觉语言模型编辑、分割、深度估计与姿态估计等环节提供可靠的数据基础。研究人员通过精心设计的场景渲染脚本与并行的物理碰撞检测机制，确保了数据的一致性与可复现性。该数据集对机器人学习、仿真到现实迁移以及灵巧操作等领域具有重要的推动作用，为相关研究提供了一个标准化且可扩展的基准测试平台。

当前挑战

数据集所解决的领域问题在于机器人操作中的目标位姿估计与物理合理性验证，这要求生成的数据不仅视觉上逼真，更需满足几何与动力学的约束。构建过程中面临的主要挑战包括：首先，不同物体因其形状与尺寸差异，需要自动计算其在桌面或墙面上的精确放置位置，例如容器与目标的相对偏移必须考虑包围盒的交集以避免穿透。其次，物理仿真中视觉网格与碰撞网格的不一致性导致需要手动设定容器位置偏移，以弥合两者间的几何差异。此外，对于像碗架中盘子尺寸过大这样的特殊情况，必须对模型进行预缩放以避免完全碰撞，增加了数据处理复杂度。最后，将场景渲染脚本与物理验证脚本集成在单一流水线中，并处理好依赖路径与运行环境的一致性，也是工程实现上的显著挑战。

常用场景

经典使用场景

goal_gen_cases数据集在机器人操作与物体重排领域中扮演着至关重要的基准角色，专为评估和验证基于目标图像的物体操控流水线而设计。该数据集囊括了八种精细编排的操控案例，涵盖了诸如杯子置于杯架、碗碟归纳于碗架、剪刀插入剪刀架、酒瓶安放于酒架以及衣架悬挂于壁钩等典型家庭与工业场景。研究者可利用该数据集中的渲染脚本与物理参数，系统性地测试视觉感知、姿态估计与物理仿真之间的联动效果，尤其适用于验证物体从初始状态到目标状态的完整推理链条，为后续智能操作系统的开发奠定了坚实的实验基础。

解决学术问题

该数据集精准回应当前机器人学领域中物体操作泛化性不足与仿真环境真实度欠缺的核心困境。其通过提供完备的场景渲染、碰撞网格与物理验证脚本，有效解决了从单视图图像中估计物体精确姿态并将其稳固放置于指定容器内的学术挑战。研究者可借此深入研究视觉与物理之间的交叉验证机制，探索如何在包含复杂几何约束（如碗架间隙限制、壁钩悬挂稳定性）的条件下达成可靠的操控决策。这一范式的确立，推动了机器人操作从理想化仿真迈向更具现实意义的物理交互研究，其影响深远，为后续领域内关于鲁棒性与自适应性的理论突破提供了关键的数据支撑。

实际应用

在实际应用层面，goal_gen_cases数据集所涵盖的场景直接映射至智能家居服务、物流自动化以及精密装配等领域的核心需求。例如，家庭服务机器人可利用该数据集衍生的算法，学会将碗碟整齐放入洗碗架、将衣架稳妥挂上壁钩，从而大幅提升日常家务的自主完成度。在工业环境中，数据集所验证的物体姿态精炼与碰撞避免策略，可迁移至生产线上的工件拾取与安放任务，减少因定位误差导致的设备损坏与生产中断。这些应用不仅提升了机器人系统的操作精度与自适应能力，更为非结构化环境下的无人化作业提供了切实可行的技术路径，展现出从学术研究到产业落地的强大转化潜力。

数据集最近研究