piper_cube

Hugging Face2026-01-16 更新2026-01-17 收录

下载链接：

https://huggingface.co/datasets/dididog/piper_cube

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。包含67个episodes，18600帧，1个任务。数据以parquet格式存储，包含状态观测（7个关节和夹爪状态）、动作（7个关节和夹爪动作）、来自手眼相机和前下方相机的图像观测（360x640分辨率，30fps）、时间戳、帧索引、episode索引等多种特征。

创建时间：

2026-01-15

原始信息汇总

数据集概述

基本信息

数据集名称: piper_cube
创建工具: LeRobot (https://github.com/huggingface/lerobot)
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0

数据集规模

总情节数: 67
总帧数: 18600
总任务数: 1
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分块大小: 1000
数据划分: 训练集包含全部67个情节

数据结构与特征

数据以Parquet文件格式存储，视频以MP4格式存储。

特征字段

observation.state
- 数据类型: float32
- 形状: [7]
- 描述: 机器人关节状态，包括 j1, j2, j3, j4, j5, j6, gripper
action
- 数据类型: float32
- 形状: [7]
- 描述: 机器人动作，包括 j1, j2, j3, j4, j5, j6, gripper
observation.images._camera_eye_in_hand_color_image_rect_raw
- 数据类型: 视频
- 形状: [360, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 编码: AV1
  - 像素格式: yuv420p
  - 非深度图
  - 帧率: 30 FPS
  - 通道数: 3
  - 无音频
observation.images._camera_front_lower_color_image_raw
- 数据类型: 视频
- 形状: [360, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 编码: AV1
  - 像素格式: yuv420p
  - 非深度图
  - 帧率: 30 FPS
  - 通道数: 3
  - 无音频
timestamp
- 数据类型: float32
- 形状: [1]
frame_index
- 数据类型: int64
- 形状: [1]
episode_index
- 数据类型: int64
- 形状: [1]
index
- 数据类型: int64
- 形状: [1]
task_index
- 数据类型: int64
- 形状: [1]

文件路径模式

数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

备注

主页与论文信息暂缺。
引用信息暂缺。

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动模仿学习与强化学习算法的发展至关重要。piper_cube数据集依托LeRobot开源框架构建而成，其采集过程系统性地记录了机械臂执行单一任务时的多模态交互数据。该数据集共包含67个完整操作序列，总计18600帧数据，以30帧每秒的速率同步捕获了机械臂关节状态、末端执行器动作以及双视角视觉信息。数据以分块Parquet格式存储，并辅以AV1编码的MP4视频文件，确保了高效存取与长期可追溯性。

特点

该数据集的核心特征在于其精心设计的结构化多模态表示。观测空间不仅涵盖7维关节角度与夹爪状态构成的低维向量，更整合了来自手眼相机与前置相机的双路RGB视频流，每路视频分辨率达640x360，为算法提供了丰富的场景上下文。数据组织遵循严格的时间对齐，每帧均附带精确的时间戳、帧索引与回合标识，支持时序建模与跨回合分析。特征定义采用分层命名规范，兼顾了机器可读性与人类可理解性，为机器人感知与控制研究提供了标准化基准。

使用方法

研究者可利用该数据集进行端到端机器人策略学习或行为克隆模型的训练与验证。数据加载可通过LeRobot框架或直接解析Parquet文件实现，其分块存储设计便于流式读取与分布式处理。典型工作流程包括从指定路径加载数据块，提取关节状态、动作指令及同步视频帧，进而构建状态-动作对序列。由于数据集已预划分为训练集，用户可直接用于模型训练，并通过帧索引与回合索引实现数据切片与批次生成，为机器人学习算法的实验与复现提供了便捷接口。

背景与挑战

背景概述

机器人学习领域近年来致力于通过大规模真实世界交互数据推动模仿学习与强化学习算法的发展。piper_cube数据集作为LeRobot项目的一部分，由HuggingFace社区于近期构建，旨在为机器人操作任务提供多模态的演示数据。该数据集聚焦于机械臂的立方体操作任务，其核心研究问题在于如何从包含关节状态、动作指令及多视角视觉观测的高维序列数据中，学习有效的控制策略以泛化至动态环境。尽管其具体创建时间与主要研究人员信息尚未公开，但依托开源社区生态，该数据集为机器人技能学习提供了宝贵的真实交互轨迹，有望促进端到端策略学习模型的实证研究。

当前挑战

piper_cube数据集所针对的机器人操作任务，面临高维连续状态与动作空间的建模挑战，以及从视觉输入到关节控制指令的复杂映射问题。具体而言，算法需处理多视角视频流与低维状态信息的异构融合，并克服真实环境中光照变化、物体位姿不确定性及机械臂动力学固有的延迟与噪声干扰。在数据构建层面，挑战主要源于大规模真实机器人数据采集的复杂性，包括硬件同步、传感器校准、数据存储与高效编码；同时，确保演示数据覆盖足够的行为多样性以支撑策略泛化，亦需精心设计任务范式和采集流程，这对资源投入与工程实现提出了较高要求。

常用场景

经典使用场景

在机器人学习领域，piper_cube数据集以其丰富的多模态观测数据，成为训练机器人操作任务模型的经典资源。该数据集通过整合关节状态、视觉图像与动作指令，为模仿学习与强化学习算法提供了标准化的实验平台。研究者能够利用其结构化的序列数据，模拟机械臂在真实环境中的抓取与操控行为，从而优化策略网络的泛化能力。

衍生相关工作

基于piper_cube数据集，学术界衍生出多项经典工作，包括基于视觉的模仿学习框架与多任务强化学习模型。这些研究利用数据集的时序特性，探索了动作预测与状态估计的联合优化方法。部分工作进一步扩展了数据集的用途，开发了跨机器人平台的迁移学习算法，为开源机器人社区提供了可复现的基准测试方案。

数据集最近研究