maniskill_pi0

Hugging Face2025-06-16 更新2025-06-17 收录

下载链接：

https://huggingface.co/datasets/Ruoxiang/maniskill_pi0

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人领域的任务数据集，特别是为Panda机器人设计的。数据集包含100个episode，共10771个frames，专注于1个task，没有包含视频文件。数据集分为1个chunk，每个chunk包含1000个数据点，帧率为50fps。数据集目前只有训练集部分。数据以Parquet文件格式存储，并提供了详细的特征信息，包括图像、手腕图像、状态、动作、时间戳、帧索引、episode索引、索引和任务索引等。数据集遵循Apache-2.0许可证。

创建时间：

2025-06-14

原始信息汇总

数据集概述

基本信息

名称: maniskill_pi0
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
代码库版本: v2.0

数据集结构

数据文件格式: Parquet
总任务数: 1
总片段数: 100
总帧数: 10771
总视频数: 0
总块数: 1
块大小: 1000
帧率: 50 fps
训练集划分: 0:100

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

图像:
- 数据类型: 图像
- 形状: [224, 224, 3]
- 维度名称: ["height", "width", "channel"]
腕部图像:
- 数据类型: 图像
- 形状: [224, 224, 3]
- 维度名称: ["height", "width", "channel"]
状态:
- 数据类型: float32
- 形状: [16]
- 维度名称: ["state"]
动作:
- 数据类型: float32
- 形状: [7]
- 维度名称: ["actions"]
时间戳:
- 数据类型: float32
- 形状: [1]
- 维度名称: 无
帧索引:
- 数据类型: int64
- 形状: [1]
- 维度名称: 无
片段索引:
- 数据类型: int64
- 形状: [1]
- 维度名称: 无
索引:
- 数据类型: int64
- 形状: [1]
- 维度名称: 无
任务索引:
- 数据类型: int64
- 形状: [1]
- 维度名称: 无

机器人信息

机器人类型: panda

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作研究领域，maniskill_pi0数据集通过LeRobot平台精心构建，采用模块化数据采集策略。该数据集以Franka Emika Panda机械臂为实验载体，以50Hz的采样频率记录了100个完整操作序列，共计10771帧动作数据。数据存储采用高效的Parquet列式文件格式，按1000帧为单元进行分块管理，确保了大规模机器人操作数据的高效存取与处理。

特点

该数据集在机器人操作学习领域展现出鲜明的多模态特性，同时包含224x224分辨率的全局视觉和腕部视觉图像，以及16维状态向量与7维动作空间数据。时序信息通过精确的时间戳和帧索引实现毫秒级对齐，支持端到端的模仿学习与强化学习算法开发。数据结构的精心设计体现在每个字段的明确数据类型定义与维度标注上，为研究者提供了清晰的接口规范。

使用方法

研究者可通过加载Parquet文件直接访问多模态数据流，利用内置的帧索引和任务索引快速定位特定操作片段。数据集默认配置为训练集划分，支持通过episode_chunk和episode_index参数实现高效的数据遍历。对于视觉-动作联合建模任务，建议同步加载image/wrist_image与actions字段；状态预测任务则可重点关注state字段的时间序列特性。

背景与挑战

背景概述

maniskill_pi0数据集是机器人领域的一项重要资源，由LeRobot团队基于Apache 2.0许可证构建。该数据集专注于机器人操作任务，采用Franka Emika Panda机械臂作为实验平台，旨在为机器人学习算法提供高质量的示范数据。数据集包含100个完整操作序列，共计10771帧数据，采样频率为50Hz，涵盖了状态观测、动作执行及多模态感知信息。其核心研究问题聚焦于如何通过大规模真实世界交互数据提升机器人模仿学习与强化学习的性能，为机器人自主操作能力的进步奠定了数据基础。

当前挑战

maniskill_pi0数据集面临的挑战主要体现在两个方面：在领域问题层面，机器人操作任务固有的高维度状态空间和连续动作空间对算法的样本效率与泛化能力提出了严峻考验，如何从有限示范中提取可迁移的技能表征成为关键难题；在构建过程层面，多模态数据（包括视觉图像、关节状态与动作指令）的精确同步采集与标注需要复杂的硬件同步系统，且机械臂控制过程中的噪声干扰与传感器漂移对数据质量造成显著影响。此外，操作任务的长时程特性导致数据分布存在显著的时间相关性，这对数据分割与评估策略设计提出了特殊要求。

常用场景

经典使用场景

在机器人控制与强化学习领域，maniskill_pi0数据集为研究者提供了一个标准化的实验平台。该数据集记录了机械臂（Panda）在执行任务时的状态、动作及视觉信息，特别适用于研究基于视觉的端到端机器人控制策略。通过包含高频率的状态采样和同步的视觉数据，该数据集能够支持复杂任务如物体抓取、避障等场景的算法开发与验证。

解决学术问题

maniskill_pi0数据集有效解决了机器人控制研究中数据稀缺与标准化不足的问题。其多模态数据（状态、动作、视觉）的同步记录为研究传感器融合、模仿学习以及强化学习策略的泛化性提供了基础。通过提供真实机械臂的操作数据，该数据集显著降低了实验成本，并支持学术界对机器人任务可重复性与基准测试的探索。

衍生相关工作

围绕maniskill_pi0数据集，已衍生出多项机器人学习领域的经典研究。例如基于其多模态数据开发的Hierarchical Reinforcement Learning框架，以及结合视觉与状态信息的跨任务迁移学习方法。这些工作不仅验证了数据集的价值，还推动了模仿学习与强化学习在真实机器人系统中的融合应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集