five

AIRBOT_MMK2_place_the_umbrella_and_the_ruler

收藏
Hugging Face2025-11-27 更新2025-11-28 收录
下载链接:
https://huggingface.co/datasets/RoboCOIN/AIRBOT_MMK2_place_the_umbrella_and_the_ruler
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个基于LeRobot扩展格式的数据集,完全兼容LeRobot。数据集使用AIRBOT_MMK2机器人,代码库版本为v2.1,末端执行器类型为五指手。数据集涵盖了家庭场景类型,包括抓取、放置和拾取等原子动作。数据集包含丰富的注释和特征,以支持各种学习方法。数据集分为训练集和测试集,并按照LeRobot格式组织。数据集以Apache-2.0许可证发布。
创建时间:
2025-11-18
原始信息汇总

AIRBOT_MMK2_place_the_umbrella_and_the_ruler 数据集概述

📋 数据集基本信息

  • 数据集名称: AIRBOT_MMK2_place_the_umbrella_and_the_ruler
  • 许可证: apache-2.0
  • 支持语言: 英语、中文
  • 任务类别: 机器人技术
  • 标签: RoboCOIN, LeRobot
  • 规模分类: 1K-10K

🤖 机器人配置

  • 机器人类型: AIRBOT_MMK2
  • 代码库版本: v2.1
  • 末端执行器类型: 五指手

🏠 场景类型

  • 家庭场景

⚡ 原子动作

  • 抓取
  • 放置
  • 拾取

📊 数据集统计

指标 数值
总情节数 42
总帧数 7298
总任务数 1
总视频数 168
总分块数 1
分块大小 1000
帧率 30

🎯 任务描述

主要任务

用一只手拿起小伞放入白色盖子中,然后用另一只手拿起测量尺放入白色盖子中

子任务

  1. 结束
  2. 用右手夹爪抓取卷尺
  3. 用左手夹爪抓取雨伞
  4. 用右手夹爪将卷尺放入白色篮子
  5. 用左手夹爪将雨伞放入白色篮子
  6. 静态

🎥 相机视角

  • 包含4个相机视角

🏷️ 可用标注

子任务标注

  • 细粒度子任务分割和标注

场景标注

  • 场景级描述和语义场景分类

末端执行器标注

  • 方向:机器人末端执行器运动方向分类
  • 速度:操作过程中的速度幅度分类
  • 加速度:运动分析的加速度幅度分类

夹爪标注

  • 夹爪模式:夹爪开/关状态标注
  • 夹爪活动:活动状态分类(活动/非活动)

附加特征

  • 末端执行器仿真位姿:仿真空间中末端执行器的6D位姿信息(状态和动作)
  • 夹爪开度尺度:连续夹爪开度测量(状态和动作)

📂 数据划分

  • 训练集: 情节0-41

📁 数据集结构

数据文件组成

  • 视频: 包含RGB相机观测的压缩视频文件
  • 状态数据: 机器人关节位置、速度和其他状态信息
  • 动作数据: 机器人动作命令和轨迹
  • 元数据: 情节元数据、时间戳和标注

文件组织模式

  • 数据路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
  • 分块: 数据组织为1个分块,每个分块大小1000

特征架构

视觉观测

  • observation.images.cam_high_rgb: 视频 (FPS: 30, 编码: av1)
  • observation.images.cam_left_wrist_rgb: 视频 (FPS: 30, 编码: av1)
  • observation.images.cam_right_wrist_rgb: 视频 (FPS: 30, 编码: av1)
  • observation.images.cam_third_view: 视频 (FPS: 30, 编码: av1)

状态和动作

  • observation.state: float32
  • action: float32

时间信息

  • timestamp: float32
  • frame_index: int64
  • episode_index: int64
  • index: int64
  • task_index: int64

标注

  • subtask_annotation: int32
  • scene_annotation: int32

运动特征

  • eef_sim_pose_state: float32 (12维)
  • eef_sim_pose_action: float32 (12维)
  • eef_direction_state: int32 (2维)
  • eef_direction_action: int32 (2维)
  • eef_velocity_state: int32 (2维)
  • eef_velocity_action: int32 (2维)
  • eef_acc_mag_state: int32 (2维)
  • eef_acc_mag_action: int32 (2维)

🔗 相关链接

  • 主页: https://flagopen.github.io/RoboCOIN/
  • 论文: https://arxiv.org/abs/2511.17441
  • 代码库: https://github.com/FlagOpen/RoboCOIN
  • 项目页面: https://flagopen.github.io/RoboCOIN/
  • 问题反馈: https://github.com/FlagOpen/RoboCOIN/issues

📄 引用信息

bibtex @article{robocoin, title={RoboCOIN: An Open-Sourced Bimanual Robotic Data Collection for Integrated Manipulation}, author={Shihan Wu, Xuecheng Liu, Shaoxuan Xie, Pengwei Wang, Xinghang Li, Bowen Yang, Zhe Li, Kai Zhu, Hongyu Wu, Yiheng Liu, Zhaoye Long, Yue Wang, Chong Liu, Dihan Wang, Ziqiang Ni, Xiang Yang, You Liu, Ruoxuan Feng, Runtian Xu, Lei Zhang, Denghang Huang, Chenghao Jin, Anlan Yin, Xinlong Wang, Zhenguo Sun, Junkai Zhao, Mengfei Du, Mingyu Cao, Xiansheng Chen, Hongyang Cheng, Xiaojie Zhang, Yankai Fu, Ning Chen, Cheng Chi, Sixiang Chen, Huaihai Lyu, Xiaoshuai Hao, Yequan Wang, Bo Lei, Dong Liu, Xi Yang, Yance Jiao, Tengfei Pan, Yunyan Zhang, Songjing Wang, Ziqian Zhang, Xu Liu, Ji Zhang, Caowei Meng, Zhizheng Zhang, Jiyang Gao, Song Wang, Xiaokun Leng, Zhiqiang Xie, Zhenzhen Zhou, Peng Huang, Wu Yang, Yandong Guo, Yichao Zhu, Suibing Zheng, Hao Cheng, Xinmin Ding, Yang Yue, Huanqian Wang, Chi Chen, Jingrui Pang, YuXi Qian, Haoran Geng, Lianli Gao, Haiyuan Li, Bin Fang, Gao Huang, Yaodong Yang, Hao Dong, He Wang, Hang Zhao, Yadong Mu, Di Hu, Hao Zhao, Tiejun Huang, Shanghang Zhang, Yonghua Lin, Zhongyuan Wang and Guocai Yao}, journal={arXiv preprint arXiv:2511.17441}, url = {https://arxiv.org/abs/2511.17441}, year={2025} }

📌 版本信息

  • v1.0.0 (2025-11): 初始发布
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作研究领域,AIRBOT_MMK2_place_the_umbrella_and_the_ruler数据集基于LeRobot扩展格式构建,采用双手机器人AIRBOT_MMK2执行伞与尺的放置任务。数据采集通过42个完整交互片段实现,涵盖7298帧视觉与运动数据,以家庭场景为背景记录抓取、放置等原子动作。所有数据按时间序列组织为分块存储的Parquet文件,并同步保存四路视角的高清视频流,确保动作轨迹与状态变化的精确对齐。
特点
该数据集的核心价值在于其多维度的精细标注体系,不仅包含机器人关节状态与动作指令的36维向量,还提供末端执行器的六维位姿、运动方向及加速度等动力学特征。四路摄像机视角覆盖全局与局部观察,配合细粒度子任务分割标注,为模仿学习与策略优化研究提供立体化数据支撑。独特的双手协同操作记录方式,使得数据集能够完整呈现复杂物体交互过程中的时空关联特性。
使用方法
研究者可通过LeRobot兼容接口直接加载数据集,利用预定义的数据路径模式访问分块存储的交互片段。训练阶段可调用视觉观察、状态动作对及动力学注解联合建模,视频流与传感器数据的帧级同步支持端到端策略学习。对于特定研究需求,可基于子任务标注实现分层强化学习,或利用末端执行器轨迹数据开发精细动作生成模型。
背景与挑战
背景概述
在机器人操作领域,双手机器人协同任务的研究逐渐成为前沿方向。AIRBOT_MMK2_place_the_umbrella_and_the_ruler数据集由RoboCOIN团队于2025年发布,依托LeRobot框架构建,专注于家庭环境中的物体放置任务。该数据集通过AIRBOT_MMK2机器人平台,记录双手抓取雨伞与测量尺并放置于指定容器的完整操作序列,旨在解决复杂场景下双肢协调与精细操作的核心问题。其多视角视觉数据与丰富的运动注解为模仿学习与策略优化提供了重要支撑,推动了具身智能在真实环境中的适应性研究。
当前挑战
该数据集针对双手机器人操作中的时序协调与物体交互精度提出挑战。具体而言,任务要求左右机械臂分别抓取不同形态的物体并完成精准放置,需克服抓取姿态规划、避障轨迹生成以及双手动作同步等难点。在构建过程中,数据采集面临多传感器时序对齐、高维状态空间标注的复杂性,同时需确保四路视觉数据与36维关节动作的严格同步。此外,模拟环境与真实物理参数的差异也为运动轨迹的泛化性带来持续挑战。
常用场景
经典使用场景
在机器人操作学习领域,该数据集通过记录AIRBOT_MMK2双臂机器人执行雨伞与测量尺放置任务的完整过程,为模仿学习与强化学习算法提供了标准化的训练样本。其多视角视觉数据与精细的动作标注使得研究者能够深入分析双手协调操作中的时序依赖关系,特别是抓取、放置等基础动作在家庭环境中的执行模式,为复杂任务分解研究奠定了数据基础。
实际应用
在家庭服务机器人开发中,该数据集支撑了物品整理、精细抓取等实际功能的算法优化。通过模拟真实家庭场景中的物体摆放任务,为服务型机器人的环境适应性训练提供了标准参照,其多指灵巧手的操作数据对开发具备精细操作能力的家政机器人具有直接的技术参考价值。
衍生相关工作
基于该数据集衍生的经典研究包括RoboCOIN项目中的多智能体协同操作框架,以及LeRobot生态系统中对双臂操作任务的标准化评估体系。这些工作通过利用数据集提供的多模态交互数据,进一步发展了分层强化学习、跨任务迁移等方法,推动了机器人操作学习领域的算法创新与基准建立。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作