move_banana_to_box_3

Hugging Face2025-10-25 更新2025-10-26 收录

下载链接：

https://huggingface.co/datasets/luobai/move_banana_to_box_3

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot创建的机器人数据集，包含26个视频，每个视频包含多个帧，总共10719帧。数据集特征包括机器人的状态、动作、速度、主图像等信息。数据以parquet格式存储，并配有对应的视频文件。该数据集适用于机器人学领域的研究，特别是在机器人臂和抓取任务方面。

创建时间：

2025-10-13

原始信息汇总

数据集概述

基本信息

数据集名称: move_banana_to_box_3
许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot、franka research 3、操作、拾取放置

数据集创建

使用LeRobot创建：https://github.com/huggingface/lerobot

数据集结构

总任务数: 1
总情节数: 26
总帧数: 10719
总视频数: 26
数据块数: 1
块大小: 1000
帧率: 30 fps
分割: 训练集（0:26）

数据特征

观察特征

observation.state:
- 数据类型: float32
- 形状: [8]
- 电机名称: robot_arm_0至robot_arm_6、gripper
observation.velocities:
- 数据类型: float32
- 形状: [8]
- 电机名称: robot_arm_0至robot_arm_6、gripper
observation.images.main:
- 数据类型: 视频
- 形状: [480, 640, 3]
- 维度名称: 高度、宽度、RGB
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30
  - 通道数: 3
  - 包含音频: false

动作特征

action:
- 数据类型: float32
- 形状: [8]
- 电机名称: robot_arm_0至robot_arm_6、gripper

索引特征

timestamp: float32，形状[1]
frame_index: int64，形状[1]
episode_index: int64，形状[1]
index: int64，形状[1]
task_index: int64，形状[1]

文件路径格式

数据文件: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

引用信息

论文: 待补充
主页: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人操作领域，move_banana_to_box_3数据集通过LeRobot框架系统采集，采用Franka Research 3机械臂执行拾放任务。数据以30帧每秒的速率记录，涵盖26个完整操作序列，总计10719帧数据，并以分块Parquet格式存储，确保高效访问与完整性。每个数据块包含机器人状态、动作指令及视觉信息，构建过程注重多模态数据的同步与对齐。

特点

该数据集的核心特点在于其丰富的多模态结构，整合了8维关节状态、动作控制向量及480x640像素的RGB视频流。数据特征命名清晰，涵盖机械臂各关节与夹爪的实时信息，支持精确的机器人行为分析。视频数据采用AV1编码，平衡了存储效率与视觉质量，为研究提供高保真的环境观测基础。

使用方法

利用该数据集时，用户可通过指定数据路径加载训练集，解析Parquet文件获取状态、动作及图像序列。帧索引与时间戳支持时序分析，适用于强化学习或模仿学习算法的训练。视频文件独立存储，便于可视化验证，整体设计兼顾算法开发与实验复现的便捷性。

背景与挑战

背景概述

机器人操作领域近年来在工业自动化和服务机器人应用中展现出巨大潜力，move_banana_to_box_3数据集作为LeRobot项目的重要组成部分，聚焦于机械臂抓取与放置任务的技术实现。该数据集采用Franka Research 3型七自由度机械臂平台，通过26个完整操作序列记录了机械臂状态、动作指令与视觉观测数据，为模仿学习与强化学习算法提供了真实世界的交互轨迹。其多模态数据结构融合了关节空间运动参数与480×640分辨率的视觉信息，构建起物理交互与感知决策的桥梁，对推动机器人精细操作能力的发展具有显著意义。

当前挑战

在机器人操作任务层面，该数据集致力于解决动态环境中物体定位精度与抓取稳定性之间的平衡难题，需要克服视觉遮挡、光照变化对目标识别的影响，以及机械臂运动轨迹在避障与效率之间的优化问题。数据构建过程中面临传感器同步校准的技术瓶颈，八维动作空间与高维视觉数据的实时对齐要求精密的时间戳管理，而操作场景的有限多样性（仅包含单一任务）也制约了模型的泛化能力。此外，多模态数据存储与传输效率的平衡，以及动作指令与实际运动轨迹间的延迟补偿，都是构建过程中需要攻克的关键技术挑战。

常用场景

经典使用场景

在机器人操作领域，move_banana_to_box_3数据集为机械臂抓取与放置任务提供了标准化实验平台。该数据集通过Franka Research 3机械臂记录的26个完整操作序列，精确捕捉了从香蕉抓取到目标箱放置的全过程运动轨迹。其多模态数据结构融合了关节状态、视觉图像与控制指令，为模仿学习算法提供了丰富的训练样本，特别适用于研究动态环境下的精细操作策略。

解决学术问题

该数据集有效解决了机器人操作中动作泛化与状态估计的核心难题。通过提供真实世界的物理交互数据，研究者能够深入探索高维状态空间下的运动规划问题。其精确的时间同步机制与多传感器融合特性，为验证基于视觉的伺服控制、强化学习策略迁移等理论提供了实证基础，显著推进了机器人自主操作系统的认知建模研究。

衍生相关工作

以该数据集为基准，研究者开发了系列端到端操作学习框架。LeRobot项目团队基于此类数据构建了分层强化学习模型，实现了跨任务的动作泛化。后续研究进一步拓展了多任务联合训练范式，催生了如基于Transformer的行为克隆、时空注意力机制等创新方法，持续推动着机器人操作智能的技术演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集