five

bimanual_blue_block_handover_22

收藏
Hugging Face2025-11-19 更新2025-11-20 收录
下载链接:
https://huggingface.co/datasets/Mimic-Robotics/bimanual_blue_block_handover_22
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人数据集,包含20个剧集,共22842帧,分为1个任务。数据集包含60个视频文件,所有数据被打包在1个片段中,每个片段包含1000帧。数据集的帧率为30fps,并且目前只提供了训练分割。数据集的特征包括机器人的动作和状态,以及三个不同的视频流(右手腕、左手腕和顶部RealSense摄像头)。所有视频流都是480x640的分辨率,使用av1编码,没有音频。

This robotic dataset contains 20 episodes with a total of 22,842 frames, targeting a single task. The dataset includes 60 video files, with all data packaged into one segment, where each segment contains 1,000 frames. It has a frame rate of 30 fps, and only the training split is currently available. The dataset features robot actions and states, as well as three distinct video streams: right wrist, left wrist, and top-mounted RealSense camera. All video streams have a resolution of 480×640, use AV1 encoding, and contain no audio.
创建时间:
2025-11-15
原始信息汇总

数据集概述

基本信息

  • 数据集名称: bimanual_blue_block_handover_22
  • 创建工具: LeRobot
  • 许可证: Apache-2.0
  • 任务类别: 机器人技术

数据集规模

  • 总任务数: 1
  • 总片段数: 20
  • 总帧数: 22842
  • 总视频数: 60
  • 数据块数: 1
  • 块大小: 1000
  • 帧率: 30 fps

数据划分

  • 训练集: 0:20(全部数据)

数据结构

数据文件路径

  • 数据文件: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征字段

动作特征

  • 名称: action
  • 数据类型: float32
  • 维度: [12]
  • 关节位置:
    • left_shoulder_pan.pos
    • left_shoulder_lift.pos
    • left_elbow_flex.pos
    • left_wrist_flex.pos
    • left_wrist_roll.pos
    • left_gripper.pos
    • right_shoulder_pan.pos
    • right_shoulder_lift.pos
    • right_elbow_flex.pos
    • right_wrist_flex.pos
    • right_wrist_roll.pos
    • right_gripper.pos

观测状态

  • 名称: observation.state
  • 数据类型: float32
  • 维度: [12]
  • 关节位置: 与动作特征相同

图像观测

右侧腕部摄像头:

  • 名称: observation.images.wrist_right
  • 数据类型: video
  • 分辨率: 480×640×3
  • 编码: AV1
  • 像素格式: yuv420p
  • 非深度图

左侧腕部摄像头:

  • 名称: observation.images.wrist_left
  • 数据类型: video
  • 分辨率: 480×640×3
  • 编码: AV1
  • 像素格式: yuv420p
  • 非深度图

顶部RealSense摄像头:

  • 名称: observation.images.realsense_top
  • 数据类型: video
  • 分辨率: 480×640×3
  • 编码: AV1
  • 像素格式: yuv420p
  • 非深度图

索引信息

  • 时间戳: float32[1]
  • 帧索引: int64[1]
  • 片段索引: int64[1]
  • 索引: int64[1]
  • 任务索引: int64[1]

技术规格

  • 代码库版本: v2.1
  • 机器人类型: bi_so101_follower
  • 所有视频均无音频
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人协作任务研究领域,该数据集通过LeRobot平台系统采集双手机器人执行蓝色积木交接任务的动态数据。构建过程包含20个完整交互片段,以30帧/秒的采样频率记录22842帧时序数据,采用分块存储架构将动作轨迹与多视角视觉信息同步封装于Parquet格式文件中。数据采集依托双索101型跟随机器人平台,通过预设的机械臂关节空间坐标与夹爪状态构建12维动作向量,确保操作序列的时空一致性。
特点
该数据集显著特征体现在多模态数据融合与精细的动作表征维度。除包含左右机械臂12个关节的位置控制信号外,还集成右手腕、左手腕及顶部RealSense相机三路视觉数据流,形成480×640分辨率的RGB视频记录。数据架构采用分层命名机制,明确区分观测状态、动作指令与元数据索引,支持对双工操作链路的端到端分析。所有视觉数据均采用AV1编码压缩,在保证画面质量的同时优化存储效率。
使用方法
研究者可通过解析Parquet文件结构直接获取时空对齐的多模态序列,利用帧索引与片段索引重建完整任务轨迹。数据集默认划分为训练集,支持加载特定片段的动作-观测对进行模仿学习算法训练。视频数据可通过指定路径模板动态加载,配合关节位置数据实现行为克隆与强化学习应用的联合优化。该架构特别适合双手机器人协调控制、视觉运动策略学习等研究方向,为多智能体协作任务提供标准化评测基准。
背景与挑战
背景概述
在机器人协作领域,双手机器人操作任务的研究日益受到关注。bimanual_blue_block_handover_22数据集由LeRobot团队基于其开源机器人平台构建,专注于双手机器人间的物体传递行为。该数据集通过记录双手机器人各关节位置、夹爪状态及多视角视觉数据,为研究双臂协调控制与物体交接策略提供了结构化实验数据。其构建体现了机器人学中从单臂操作向复杂双臂协作的技术演进,对推动服务机器人与工业自动化发展具有重要价值。
当前挑战
该数据集致力于解决双手机器人协作中物体平稳传递的核心难题,涉及双臂运动轨迹规划、抓握力控制与视觉反馈的实时协调。在数据采集过程中,需同步处理12自由度关节动作数据与三路高清视频流,确保时序对齐与空间一致性成为关键挑战。多传感器融合带来的数据异构性,以及机械臂运动学约束下的动作空间建模,进一步增加了数据集构建的复杂性。
常用场景
经典使用场景
在机器人协作操作领域,bimanual_blue_block_handover_22数据集为双手机器人交接任务提供了标准化实验平台。该数据集通过记录双机械臂对蓝色积木的交接过程,包含关节位置、视觉观测等多模态数据,成为训练机器人精细操作能力的核心资源。研究者可利用其构建端到端模仿学习模型,使机器人学习人类演示中的协调动作模式,推动双臂协同控制技术的发展。
解决学术问题
该数据集有效解决了机器人学中双臂协调控制的三大难题:动作序列的时序对齐、多传感器数据融合以及动态环境下的抓取稳定性。通过提供精确的关节轨迹与多视角视觉数据,为研究跨模态表征学习、动作预测算法验证建立了基准。其结构化标注方式显著降低了复杂任务策略学习的建模门槛,对推进具身智能研究具有重要方法论意义。
衍生相关工作
基于该数据集衍生的经典研究包括分层强化学习框架Bi-Man-HRL,其通过解耦主从臂控制策略提升了任务完成效率。视觉触觉融合网络VitaTac借鉴其多模态标注体系,实现了仅凭视觉输入的抓取力预测。开源项目DexTransfer则利用该数据集构建了跨机器人平台的策略迁移管道,为异构机器人协作提供了标准化接口。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作