genesis_self_collect_pick_red_cube_ee_delta_v043

Hugging Face2025-11-29 更新2025-11-30 收录

下载链接：

https://huggingface.co/datasets/yananchen/genesis_self_collect_pick_red_cube_ee_delta_v043

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学数据集，包含92个集共49225帧数据，专注于一个任务。数据以Parquet文件格式存储，并伴有相应的视频文件。数据集提供了包括图像、手腕图像、状态、动作等多种特征，适用于机器人学研究。

创建时间：

2025-11-29

原始信息汇总

Genesis Self Collect Pick Red Cube EE Delta v043 数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
相关标签: LeRobot, libero, panda, franka, Genesis
代码库版本: v3.0
机器人类型: panda

数据集规模

总任务数: 1
总回合数: 92
总帧数: 49225
帧率: 10 FPS
数据文件大小: 100 MB
视频文件大小: 200 MB
分块大小: 1000

数据划分

训练集: 全部92个回合

数据特征

图像数据:
- image: 256×256×3图像数据
- wrist_image: 256×256×3腕部图像数据
状态数据:
- state: 8维浮点状态向量
- actions: 7维浮点动作向量
索引数据:
- timestamp: 时间戳
- frame_index: 帧索引
- episode_index: 回合索引
- index: 通用索引
- task_index: 任务索引

文件结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人操作研究领域，该数据集通过LeRobot平台系统采集，采用Franka Panda机械臂执行单一任务，以10帧每秒的采样频率记录操作过程。数据以分块存储形式组织，每个数据块包含1000帧信息，总计92个完整操作序列，涵盖49225帧多维观测数据，所有记录均以标准化Parquet格式保存以确保数据完整性与高效访问。

特点

该数据集呈现多维时空特征，包含双视角视觉数据与七维动作空间，其中主视角与腕部相机均提供256×256像素的RGB图像流。八维状态向量与七维动作向量构成连续决策轨迹，辅以精确的时间戳与帧索引标识，支持端到端模仿学习研究。数据规模达300MB存储容量，其结构化特征设计特别适合机器人操作策略的深度神经网络训练。

使用方法

研究者可通过解析Parquet数据文件直接获取时空对齐的多模态序列，利用帧索引与任务索引重构完整操作轨迹。视频数据与传感器读数可通过预设路径模板动态加载，训练集涵盖全部92个任务实例，适用于行为克隆、强化学习等算法验证。数据接口支持直接提取图像、状态与动作三元组，为机器人操作策略研究提供标准化实验基准。

背景与挑战

背景概述

机器人操作任务数据集作为智能系统研发的关键基础设施，其构建直接推动着具身智能与自主决策领域的发展。Genesis_self_collect_pick_red_cube_ee_delta_v043数据集由LeRobot研究团队基于Franka Panda机器人平台开发，聚焦于端到端操作策略学习这一核心研究问题。该数据集通过92个完整交互序列与近五万帧多模态数据，为机器人精细抓取任务提供了结构化训练资源，其采用的末端执行器空间动作表示机制显著提升了策略学习的可解释性与泛化能力。

当前挑战

在机器人操作任务领域，动态环境下的目标定位与精确抓取始终是核心难题，尤其当涉及非结构化场景中的小型物体交互时。本数据集构建过程中面临多模态数据同步采集的技术挑战，需协调视觉传感器与机械臂控制系统的时序一致性。高维动作空间的采样效率问题亦构成显著障碍，数据标注过程依赖复杂的运动学链解算与状态重建流程，而真实物理环境中的传感器噪声与机械延迟进一步增加了数据质量的保障难度。

常用场景

经典使用场景

在机器人操作学习领域，该数据集通过记录Franka Panda机械臂执行拾取红色立方体的完整动作序列，为模仿学习与强化学习算法提供了标准化的训练基准。其多模态数据流包含视觉观察、关节状态与动作指令，能够有效支撑端到端策略网络的训练过程，成为机器人技能获取研究的重要基础设施。

解决学术问题

该数据集主要解决了机器人操作任务中样本效率低下与仿真到现实迁移的挑战。通过提供真实世界采集的高质量示教数据，研究者可突破仿真环境的局限性，直接基于物理系统开发控制策略。其精确的时间对齐与多传感器融合特性，为研究动作表示学习、状态估计及长期任务规划等核心问题提供了可靠的数据支撑。

衍生相关工作

以该数据集为基础衍生了系列创新研究，包括基于时空注意力的操作策略网络、多任务元学习框架以及跨模态表示对齐方法。这些工作通过挖掘数据集中隐含的动作语义与状态转移规律，推动了机器人操作知识的可迁移性与泛化能力，为构建通用机器人操作系统奠定了理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集