green_cube_4

Hugging Face2026-01-23 更新2026-01-24 收录

下载链接：

https://huggingface.co/datasets/simonholmes001/green_cube_4

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人数据集，包含5个episodes和5789帧数据。数据集记录了机器人动作（6维浮点向量表示关节位置）和观测数据（状态以及顶部和前置摄像头的图像数据）。数据以parquet文件格式存储，并包含视频文件。具体特征包括：动作（shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos）、观测状态（同动作相同的6个维度）、顶部和前置摄像头图像（480x640分辨率，3通道，20fps），以及时间戳、帧索引、episode索引等元数据。

创建时间：

2026-01-22

原始信息汇总

数据集概述

基本信息

数据集名称: green_cube_4
托管平台: Hugging Face Datasets
数据集地址: https://huggingface.co/datasets/simonholmes001/green_cube_4
许可协议: Apache-2.0
任务类别: 机器人学
相关标签: LeRobot

创建与来源

该数据集使用 LeRobot 创建。
主页和论文信息暂缺。

数据集结构

整体统计

代码库版本: v3.0
机器人类型: so_follower
总情节数: 5
总帧数: 5789
总任务数: 1
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 20 FPS
数据分割: 训练集包含所有5个情节。

文件路径格式

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [6]
维度名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
形状: [6]
维度名称: 与动作特征相同。

观测图像（顶部摄像头）

数据类型: video
形状: [480, 640, 3] (高度，宽度，通道)
视频信息:
- 高度: 480
- 宽度: 640
- 编码格式: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 20
- 通道数: 3
- 是否包含音频: false

观测图像（前部摄像头）

数据类型: video
形状: [480, 640, 3] (高度，宽度，通道)
视频信息: 与顶部摄像头相同。

元数据

时间戳: 数据类型 float32，形状 [1]。
帧索引: 数据类型 int64，形状 [1]。
情节索引: 数据类型 int64，形状 [1]。
索引: 数据类型 int64，形状 [1]。
任务索引: 数据类型 int64，形状 [1]。

引用信息

引用所需的BibTeX信息暂缺。

搜集汇总

数据集介绍

构建方式

在机器人学领域，高质量的数据集对于推动模仿学习与强化学习算法的发展至关重要。green_cube_4数据集依托LeRobot平台构建，通过实际机器人操作采集了5个完整的情节，共计5789帧数据。数据以分块形式存储于Parquet文件中，每块约1000帧，确保了高效的数据管理与访问。采集过程中，机器人执行单一任务，同步记录其关节位置状态、来自顶部与前方摄像头的视觉信息以及精确的时间戳，为后续算法训练提供了多模态、时序对齐的可靠数据源。

使用方法

对于研究者而言，利用该数据集进行算法开发需遵循其特定的数据组织逻辑。数据集已预设训练集划分，涵盖全部5个情节。用户可通过加载指定的Parquet文件路径模板访问分块数据，同时关联的MP4视频文件提供了直观的视觉观测。典型的使用流程包括：解析特征字典以获取动作、状态及图像张量；依据时间戳与帧索引重建任务执行序列；进而训练行为克隆、逆动力学模型或视觉运动策略。数据集兼容主流机器人学习框架，为复现与比较算法性能提供了便利基础。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、大规模的真实世界交互数据。green_cube_4数据集由HuggingFace的LeRobot项目创建，旨在为机器人操作任务提供多模态演示数据。该数据集聚焦于机械臂控制，具体涉及so_follower型机器人，记录了包括关节位置、视觉观察（顶部与正面视角视频）在内的时序交互信息。其构建体现了开源社区推动机器人泛化能力研究的努力，通过标准化数据格式促进算法开发与评估，为机器人自主技能学习提供了宝贵的实证基础。

当前挑战

green_cube_4数据集致力于解决机器人模仿学习中从演示数据学习精细操作策略的挑战，其核心问题在于如何利用多模态观察（如视觉与状态信息）生成鲁棒且可泛化的动作序列。在构建过程中，面临数据采集的复杂性，需同步记录高维传感器数据与视频流，并确保时序对齐与标注一致性。此外，数据规模有限（仅5个片段）可能制约模型泛化能力，而多视角视觉数据的处理与融合亦对算法设计提出较高要求，需平衡计算效率与表征丰富性。

常用场景

经典使用场景

在机器人学习领域，green_cube_4数据集以其丰富的多模态数据为机器人模仿学习提供了典型范例。该数据集记录了机器人执行任务时的关节状态、视觉观察及动作序列，特别适用于训练端到端的机器人控制策略。研究者可利用其包含的顶部与正面视角视频流，结合六自由度机械臂的精确位姿信息，模拟真实环境中的操作任务，为机器人行为克隆与策略优化奠定数据基础。

解决学术问题

该数据集有效应对了机器人模仿学习中数据稀缺与多模态对齐的挑战。通过提供同步的关节状态、视觉观察和动作标签，它支持研究者探索视觉-动作映射、状态表示学习以及跨模态特征融合等核心问题。其结构化数据格式降低了机器人控制算法的验证门槛，促进了模仿学习、强化学习与视觉伺服控制等方法的比较与创新，推动了机器人自主操作技术的理论进展。

实际应用

在实际机器人部署中，green_cube_4数据集可直接用于训练工业机械臂执行物体抓取、放置或装配等任务。基于其记录的视觉与关节数据，能够开发适应动态环境的控制模型，提升机器人在物流分拣、生产线操作或服务机器人场景中的自主性与鲁棒性。数据集提供的多视角视频流还可支持机器人场景理解与避障算法的测试，加速从仿真到实物的技术迁移。

数据集最近研究