franka_task03

Hugging Face2026-04-17 更新2026-04-18 收录

下载链接：

https://huggingface.co/datasets/chiro1217/franka_task03

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，采用Apache-2.0许可证发布，属于机器人学领域。数据集包含80个episodes，总计44838帧数据，适用于机器人控制与行为学习任务。数据存储为parquet格式，包含多种特征字段，如观察图像（image_additional_view和image，分辨率分别为480x640和395x590）、机器人状态（7维浮点数组）、动作（7维浮点数组）以及时间戳等。视频数据采用AV1编码，帧率为10fps，无音频。数据集结构通过meta/info.json文件详细描述，包括数据路径、视频路径及各字段的数据类型和形状。

创建时间：

2026-04-17

原始信息汇总

数据集概述

基本描述

数据集名称: franka_task03
创建工具: 使用LeRobot创建
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0

数据集结构

数据格式: Parquet文件
数据文件路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

数据规模

总任务数: 1
总片段数: 80
总帧数: 44838
总视频数: 160
数据块数: 1
数据块大小: 100
帧率: 10 FPS
数据划分: 训练集包含全部80个片段

特征字段

观测数据

observation.images.image_additional_view
- 数据类型: 视频
- 视频分辨率: 高度480像素，宽度640像素，3通道（RGB）
- 视频编码: AV1
- 像素格式: yuv420p
- 帧率: 10.0 FPS
- 音频: 无
- 深度图: 否
observation.images.image
- 数据类型: 视频
- 视频分辨率: 高度395像素，宽度590像素，3通道（RGB）
- 视频编码: AV1
- 像素格式: yuv420p
- 帧率: 10.0 FPS
- 音频: 无
- 深度图: 否
observation.state
- 数据类型: float32
- 形状: [7]
- 维度名称: 对应机械臂的x、y、z、roll、pitch、yaw、width

动作数据

action
- 数据类型: float32
- 形状: [7]
- 维度名称: 对应机械臂的x、y、z、roll、pitch、yaw、width

元数据

timestamp: float32类型，形状[1]
frame_index: int64类型，形状[1]
episode_index: int64类型，形状[1]
index: int64类型，形状[1]
task_index: int64类型，形状[1]

技术信息

机器人类型: franka
代码库版本: v2.1
配置名称: default

引用信息

主页: 未提供
论文: 未提供
BibTeX引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作任务数据集的构建领域，franka_task03数据集依托LeRobot开源框架精心构建而成。该数据集通过采集真实机器人操作环境中的多模态交互数据，系统性地记录了Franka机械臂执行特定任务的全过程。数据采集过程以10赫兹的频率同步捕获视觉观测与机器人状态信息，涵盖主视角与附加视角的双路视频流，并以Parquet格式高效存储。整个数据集包含80个完整任务片段，总计44838帧数据，确保了任务执行的连续性与时序一致性，为机器人模仿学习提供了高质量的轨迹样本。

特点

该数据集在机器人操作数据集领域展现出鲜明的技术特色。其核心特征在于多模态数据的深度融合，不仅提供分辨率分别为395×590与480×640的双路RGB视频流，还精确记录了七维机械臂状态观测值与七维动作控制指令。数据集采用先进的AV1视频编码技术，在保证视觉信息完整性的同时显著优化存储效率。时序对齐机制通过时间戳与帧索引实现毫秒级同步，而统一的任务索引设计则确保了数据结构的规整性。这些技术特征共同构成了适用于端到端机器人策略训练的高质量数据基础。

使用方法

针对机器人模仿学习与策略训练的应用场景，该数据集提供了规范化的使用路径。研究者可通过LeRobot框架的标准数据加载接口直接访问数据集，利用预定义的数据分割方案将80个任务片段全部用于训练过程。每个数据样本均包含可直接输入神经网络的多模态观测信息与对应的动作标签，支持以帧为单位或按完整任务片段进行批量处理。视频数据可通过专用解码器实时流式读取，而状态与动作数据则以浮点张量形式提供，便于与主流深度学习框架无缝集成，加速机器人控制算法的开发与验证周期。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。franka_task03数据集由HuggingFace的LeRobot项目创建，专注于采集Franka Emika Panda机械臂执行特定任务时的多模态交互数据。该数据集包含了80个完整交互片段，总计超过4.4万帧数据，融合了双视角视觉观测、七维关节状态与动作指令，并以10Hz频率同步记录，为机器人技能学习提供了结构化的真实环境交互轨迹。其构建依托开源机器人学习框架LeRobot，旨在降低机器人数据收集与算法研究的门槛，促进社区在真实机器人操控任务上的协作与创新。

当前挑战

该数据集致力于解决机器人模仿学习中从高维视觉观测到连续动作映射的挑战，其核心问题在于如何让机械臂在动态非结构化环境中泛化执行复杂操作任务。构建过程中的挑战包括多传感器数据的精确时间同步、大规模视频数据的高效压缩存储与读取，以及确保交互轨迹在真实物理系统中的一致性与安全性。此外，数据采集需平衡任务多样性、数据规模与标注成本，同时保持机器人硬件系统的稳定运行，这对数据集的标准化与可复现性提出了较高要求。

常用场景

经典使用场景

在机器人学习领域，franka_task03数据集以其丰富的多模态数据为机器人任务学习提供了关键支持。该数据集通过记录Franka机械臂在执行特定任务时的视觉观察、状态信息及动作序列，为模仿学习与强化学习算法的训练与验证奠定了坚实基础。研究人员能够利用这些数据构建端到端的控制策略，模拟真实环境中的机器人操作过程，从而推动机器人自主执行复杂任务的能力发展。

衍生相关工作

围绕franka_task03数据集，学术界衍生了一系列经典研究工作，包括基于视觉的机器人策略学习框架、多模态融合的表示学习方法以及跨任务迁移学习算法。这些工作利用数据集的丰富特征，探索了从稀疏奖励中学习有效策略的途径，并推动了机器人学习社区在仿真到真实世界迁移方面的进展，为后续大规模机器人数据集的构建与应用提供了重要参考。

数据集最近研究