UMA-Robots/franka_panda_pick_cube_all_profiles

Name: UMA-Robots/franka_panda_pick_cube_all_profiles
Creator: UMA-Robots
Published: 2026-05-08 17:05:36
License: 暂无描述

Hugging Face2026-05-08 更新2026-05-10 收录

下载链接：

https://hf-mirror.com/datasets/UMA-Robots/franka_panda_pick_cube_all_profiles

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人操作数据集，使用Franka Panda机器人执行抓取立方体的任务。数据集包含10个episodes，1780帧数据，涵盖了机器人的动作数据（包括末端执行器位置和夹持器状态）、观测数据（包括关节状态、TCP位置和来自前端及腕部摄像头的图像数据）、时间戳和各种索引信息。数据以parquet格式存储，并包含相应的视频文件。

This dataset is a robotic manipulation dataset involving a Franka Panda robot performing cube picking tasks. It contains 10 episodes with 1780 frames of data, including action data (end-effector positions and gripper state), observation data (joint states, TCP positions, and images from front and wrist cameras), timestamps, and various indices. The data is stored in parquet format and includes corresponding video files.

提供机构：

UMA-Robots

搜集汇总

数据集介绍

构建方式

franka_panda_pick_cube_all_profiles数据集基于LeRobot框架构建，专注于机器人操作任务的模仿学习。该数据集通过Franka Panda机器人执行抓取立方体的单一任务，采集了10个完整示范回合（episodes），共计1780帧时序数据。数据以Parquet格式存储于分块文件中，同时配备AV1编码的高清视频流（前置与腕部摄像头，分辨率128×128，帧率10 FPS），为机器人的视觉-运动联合建模提供多模态支持。

特点

该数据集的核心特色在于其结构化与高维度的特征设计。动作空间包含7维连续值，涵盖末端执行器的三维位置、三维旋转以及夹爪开合度。观测状态则囊括18维数据，包括7个关节的位置与速度、夹爪位置和TCP坐标，为精细控制提供完整状态表征。此外，数据集将10个回合全部划归训练集，确保小样本模仿学习场景下的数据一致性，并且所有特征均采用float32或int64类型以保证数值精度。

使用方法

使用者可直接通过Hugging Face的LeRobot库加载该数据集，利用其默认配置读取Parquet数据文件及同步视频。建议在模仿学习或离线强化学习任务中，将action字段作为模型输出目标，observation.state与observation.images作为联合输入。由于数据集仅包含单一任务，适合用于验证算法在有限示范下的泛化能力，或作为机器人策略预训练的基础，后续可迁移至更复杂的操作场景。

背景与挑战

背景概述

在机器人学习领域，如何高效获取并利用高质量的示范数据以训练泛化性强的操控策略，始终是核心研究议题。franka_panda_pick_cube_all_profiles 数据集由 UMA-Robots 团队基于 LeRobot 框架创建，旨在为机械臂抓取任务提供标准化的多模态数据资源。该数据集聚焦于 Franka Panda 机器人拾取立方体的单一任务，共包含 10 个完整轨迹片段、1780 帧数据，以 10Hz 的频率同步采集了 7 维末端执行器动作信号、18 维关节及工具中心点状态信息，以及前端与腕部两个视角的 128×128 分辨率视频流。通过开源此数据集，研究社区能够获得一个可直接用于模仿学习或强化学习基准测试的精细操控样本集，尤其有助于推动高精度夹取与位姿控制策略的复现与对比研究。

当前挑战

所解决的领域问题在于机器人抓取任务的演示数据稀缺且异构性显著，现有公开数据集多缺乏统一格式与完整传感器模态，难以支持端到端学习方法的公平评估。该数据集通过标准化动作与状态空间、提供同步视觉观测，为攻克单物体抓取的策略泛化难题奠定了基础。构建过程中面临的挑战包括：确保 10 个示范轨迹覆盖足够多样的初始位置与姿态以逼近真实物理分布，同时协调双摄像头录制与机器人本体控制的时间对齐误差；此外，在仅 100 MB 的数据文件中压缩 200 MB 视频流，需权衡编码效率与保真度，避免因视频压缩引入的伪影干扰后续模型对细微接触动力学的学习。

常用场景

经典使用场景

在机器人学习领域，franka_panda_pick_cube_all_profiles数据集为模仿学习与行为克隆提供了理想的训练素材。该数据集记录了Franka Panda机械臂执行抓取立方体任务的完整轨迹，包含1780帧、10个episode的高质量演示数据。每个episode不仅保留了7维末端执行器动作序列（包括位置、姿态与夹爪开合），还同步采集了18维关节状态信息（涵盖位置、速度及工具中心点坐标）。更值得关注的是，数据集同时提供了前视与腕部双视角的128x128视频流，为多模态感知驱动的策略学习创造了条件。研究者可借此构建从视觉观测到动作输出的端到端映射模型，探索不同表示学习框架在精细操作任务中的表现力。

解决学术问题

该数据集精准回应了机器人操作领域中数据稀缺与泛化能力不足的核心困境。长期以来，由于真实机器人演示数据的采集成本高昂，大量研究工作受限于模拟环境或少量样本。franka_panda_pick_cube_all_profiles通过提供标准化、高保真的真实世界抓取数据，使得研究者能够系统性地验证行为克隆、逆强化学习等算法的实际效能。数据集包含的多模态信息（视觉、关节状态、动作）促使学界重新审视状态表征与动作预测之间的耦合关系，推动了关于注意力机制、时序建模在机器人策略泛化中作用的理论探讨。此外，10Hz的采样频率与完整的状态空间定义为评估模型在长程依赖与实时响应方面的能力提供了基准。

衍生相关工作

该数据集的发布催生了多个具有影响力的研究方向。基于其提供的双视角视觉流与动作标签，研究者开发了融合空间注意力与时间卷积的抓取策略网络，显著提升了复杂场景下的操作成功率。一些工作探索了利用数据集中不同profile条件下的轨迹多样性来训练具备自适应能力的鲁棒策略，使其在面对未观测到的初始配置时仍能保持稳定表现。另有研究将数据集作为数据增强的基准，通过引入随机化背景或扰动关节状态来测试策略的泛化边界。围绕该数据集还衍生出若干竞赛任务，聚焦于零样本迁移与多任务学习效率的评估，进一步拓展了其在机器人学前沿探索中的价值。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集