ManiSkill

Name: ManiSkill
Creator: 加州大学圣地亚哥分校
Published: 2021-11-04 20:11:21
License: 暂无描述

arXiv2021-11-04 更新2024-06-21 收录

下载链接：

https://github.com/haosulab/ManiSkill

下载链接

链接失效反馈

官方服务：

资源简介：

ManiSkill是一个大规模的开源基准，用于从3D视觉输入学习物理操纵技能。该数据集由加州大学圣地亚哥分校创建，包含约36,000条成功轨迹，总计约150万点云/RGB-D帧。数据集通过模拟全景相机捕捉的自我中心点云或RGB-D图像，支持多种计算机视觉模型应用。创建过程中，通过精心设计的共享奖励模板自动生成奖励函数，使用强化学习方法收集大量成功轨迹。ManiSkill旨在促进学习-从-示范方法的发展，并解决家庭环境中的多样化操纵挑战。

ManiSkill is a large-scale open-source benchmark for learning physical manipulation skills from 3D visual inputs. Developed by the University of California, San Diego, the dataset contains approximately 36,000 successful trajectories, totaling roughly 1.5 million point cloud/RGB-D frames. It provides egocentric point clouds or RGB-D images captured by simulated panoramic cameras, supporting applications across a wide range of computer vision models. During its creation, reward functions were automatically generated via meticulously designed shared reward templates, and a large corpus of successful trajectories was collected using reinforcement learning methods. ManiSkill aims to facilitate the development of learning-from-demonstration approaches and address diverse manipulation challenges in household environments.

提供机构：

加州大学圣地亚哥分校

创建时间：

2021-07-30

搜集汇总

数据集介绍

构建方式

在机器人操作技能研究领域，构建能够反映真实世界物体多样性的仿真环境至关重要。ManiSkill数据集的构建依托于SAPIEN全物理仿真器，其核心资产来源于广泛使用的PartNet-Mobility三维视觉数据集。研究团队投入大量精力对原始模型进行筛选、修复与重建模，包括手动修正标注错误、进行凸分解以优化碰撞形状，并调整物理参数以确保每个物体的操作任务均可求解。通过这种严谨的后处理流程，最终整合了涵盖柜子、椅子和水桶三个类别的162个关节物体，每个类别内部均具有显著的拓扑与几何变异，从而为评估策略的物体级泛化能力奠定了坚实基础。

使用方法

为促进跨学科研究，ManiSkill设定了清晰的多轨道训练与评估协议。研究者需在训练集物体上开发策略，并在未见过的测试集物体上评估其物体级泛化能力，评估指标为平均成功率。数据集支持三种研究轨道：‘无交互’轨道仅允许使用提供的示范轨迹进行训练，鼓励探索用于复杂拓扑形状理解的三维视觉网络架构；‘无外部标注’轨道允许在训练环境上进行在线微调，但禁止引入新标注数据，旨在促进在线训练算法研究；‘无限制’轨道则允许使用任何方法，包括标注新数据或设计传统控制规则。所有代码、环境与基线模型均已开源，便于复现与比较。

背景与挑战

背景概述

在机器人操作技能学习领域，实现从三维视觉输入中习得可泛化的物体操控能力，一直是连接计算机视觉、机器学习与机器人技术的核心挑战。ManiSkill基准数据集由加州大学圣地亚哥分校的研究团队于2021年创建，旨在通过大规模、多样化的物体模型与任务设计，系统性地评估物理操作策略的物体级泛化性能。该数据集依托SAPIEN全物理仿真器构建，精心选取并处理了来自PartNet-Mobility数据集的162个关节物体，涵盖柜门开启、抽屉拉动、椅子推动与桶搬运四类典型家庭操作任务。其核心研究问题聚焦于如何使智能体在仅接触部分训练物体后，能够将操作技能迁移至同类别未见物体，从而推动跨学科协同，促进三维深度学习与模仿学习算法在机器人操作中的实际应用。

当前挑战

ManiSkill数据集所应对的核心领域挑战在于解决从三维点云或RGB-D输入中学习可泛化物体操作策略的难题，这要求算法同时克服复杂拓扑几何理解、部分观测、机器人自遮挡以及高维连续动作空间规划等多重困难。在数据集构建过程中，研究团队面临了显著的技术挑战：首先，为确保仿真的真实性与任务的可行性，需对原始三维资产进行大量人工后处理，包括修正标注错误、手动进行凸分解以优化物理模拟，并逐一验证每个物体的可解性；其次，为支持模仿学习，需规模化收集高质量示范轨迹，团队通过设计共享奖励模板并采用分治式的强化学习训练流程，为每个训练物体生成约3.6万条成功轨迹，此过程涉及复杂的奖励函数设计与海量的计算资源调度。

常用场景

经典使用场景

在机器人操作技能泛化研究领域，ManiSkill数据集作为一项权威基准，其经典应用场景聚焦于评估从三维视觉输入中学习可泛化操作策略的算法性能。该数据集通过模拟真实世界中的多样化物体拓扑与几何变化，为研究者提供了标准化的测试平台，用以衡量算法在未见物体上的泛化能力。具体而言，研究者利用数据集中的点云或RGB-D观测数据，结合大规模示范轨迹，训练策略模型在仿真环境中执行开门、推椅等操作任务，从而系统性地检验算法在跨物体泛化、部分观测及复杂动力学交互等方面的表现。

解决学术问题

ManiSkill数据集有效应对了机器人操作研究中若干关键学术挑战。其一，它通过提供具有显著类内拓扑与几何多样性的物体资产，解决了现有基准在物体级泛化评估上的不足，使得研究能够深入探索形状理解与策略迁移的核心问题。其二，数据集支持从示范中学习与在线交互学习双轨并行的研究范式，为模仿学习、离线强化学习等算法提供了统一的比较框架。其三，其设计的四项任务涵盖了旋转关节、平移关节、平面运动及无约束运动等多种操作类型，系统性地揭示了不同运动约束下策略学习的难点，推动了跨任务泛化与技能组合的研究进展。

实际应用

ManiSkill数据集的实际应用价值体现在其为家庭服务机器人操作技能的仿真训练与算法验证提供了高保真平台。在智能家居场景中，机器人需应对柜门、抽屉、转椅等物体的多样形态，该数据集通过物理仿真生成的视觉观测与交互数据，能够支撑操作策略的预训练与快速迭代。例如，基于数据集的示范轨迹，可训练机械臂学习适应不同尺寸、把手位置的开门技能；其双臂协作推椅任务则为复杂欠驱动系统的协调控制提供了验证环境。这些仿真成果有望通过sim-to-real技术迁移至实体机器人，加速实用化操作系统的开发进程。

数据集最近研究