genesis_self_collect_pick_red_cube_ee_abs_v043

Hugging Face2025-11-29 更新2025-11-30 收录

下载链接：

https://huggingface.co/datasets/yananchen/genesis_self_collect_pick_red_cube_ee_abs_v043

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人学的数据集，包含panda类型机器人的操作数据。数据集共有109个剧集，56882帧，分为2个任务。数据以Parquet格式存储，并伴有相应的视频文件。每个数据点包含图像、手腕图像、状态、动作、时间戳、帧索引、剧集索引、索引和任务索引等信息。

创建时间：

2025-11-29

原始信息汇总

数据集概述

基本信息

数据集名称: genesis_self_collect_pick_red_cube_ee_abs_v043
许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot, libero, panda, franka, Genesis

数据集规模

总任务数: 2
总情节数: 109
总帧数: 56882
数据块大小: 1000
帧率: 10 FPS

数据存储

数据文件格式: Parquet
数据文件大小: 100 MB
视频文件大小: 200 MB
数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

图像特征:
- image: 256×256×3 RGB图像
- wrist_image: 256×256×3 RGB手腕图像
状态特征:
- state: 8维浮点数组
动作特征:
- actions: 7维浮点数组
索引特征:
- timestamp: 时间戳
- frame_index: 帧索引
- episode_index: 情节索引
- index: 通用索引
- task_index: 任务索引

技术信息

代码库版本: v3.0
机器人类型: panda
数据分割: 训练集包含所有109个情节

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人操作任务数据采集领域，该数据集通过LeRobot框架系统性地构建而成。采用Franka Panda机器人平台，以10Hz采样频率记录了109个完整操作序列，涵盖拾取红色立方体等精细任务。数据以分块存储形式组织，每1000帧构成一个数据块，最终形成总计56,882帧的视觉-动作配对数据，所有原始数据均经过标准化处理并存储为Parquet格式。

特点

该数据集呈现出多模态融合的显著特性，同时包含256×256分辨率的双视角视觉数据（环境视角与腕部视角）与7维动作向量。数据结构设计科学，每个样本均附带时间戳、任务索引与回合标识，支持时序分析与任务分类研究。其8维状态向量与动作空间的精确对应关系，为模仿学习与策略泛化研究提供了理想的数据基础。

使用方法

研究人员可通过加载标准Parquet文件直接访问多模态数据流，利用预设的帧索引与回合索引实现高效数据检索。该数据集专为机器人模仿学习算法验证设计，支持端到端策略训练、行为克隆等典型应用场景。数据划分明确标识训练集范围，使用者可依据任务索引开展跨任务泛化能力评估，或结合视频文件进行定性行为分析。

背景与挑战

背景概述

在机器人学习领域，模仿学习作为实现复杂任务自主操作的重要范式，亟需高质量的行为数据集支撑。Genesis自主采集拾取红色立方体数据集由HuggingFace的LeRobot团队基于Franka Panda机器人平台构建，通过109个任务片段记录末端执行器的绝对坐标控制轨迹。该数据集以256×256像素的双视角视觉输入与7维动作空间构成多模态交互序列，为机器人精细操作策略的泛化能力研究提供了结构化数据基础。

当前挑战

机器人操作任务面临动作空间连续性与视觉感知对齐的双重挑战，需在动态环境中实现毫米级精度的抓取轨迹规划。数据集构建过程中需克服多传感器时序同步、机械臂运动噪声抑制等工程难题，同时保持10Hz采样频率下56882帧数据的时间一致性。跨任务的动作泛化要求模型理解物体物理属性与运动约束的隐含关系，这对行为克隆算法的表征学习能力提出了更高要求。

常用场景

经典使用场景

在机器人操作任务研究领域，该数据集通过记录Franka Panda机械臂执行拾取红色立方体的动作序列，为模仿学习与强化学习算法提供了标准化的训练基准。其多模态数据流包含视觉观察、关节状态与动作轨迹，能够有效支撑端到端策略网络的训练过程，成为机器人技能学习领域的重要实验平台。

实际应用

在工业自动化与智能仓储领域，该数据集衍生的抓取策略可直接应用于物品分拣、零件装配等实际场景。其记录的精确动作轨迹为机器人柔顺控制提供了参考范本，通过迁移学习技术能够快速适配不同规格的抓取目标，有效提升生产线的作业精度与运行效率。

衍生相关工作

基于该数据集已催生多项机器人学习领域的经典研究，包括分层强化学习框架的构建、视觉-动作表征联合建模方法的探索等。这些工作通过挖掘数据集中隐含的状态转移规律，发展了基于模型预测的轨迹优化算法，为后续研究提供了重要的理论参照与技术启示。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集