five

AIRBOT_MMK2_egg_storage

收藏
Hugging Face2025-11-27 更新2025-11-28 收录
下载链接:
https://huggingface.co/datasets/RoboCOIN/AIRBOT_MMK2_egg_storage
下载链接
链接失效反馈
官方服务:
资源简介:
AIRBOT_MMK2_egg_storage 数据集使用基于 LeRobot 的扩展格式,与 LeRobot 完全兼容。它包含家庭场景类型,包括抓取、拾取和放置等原子动作。数据集包括 58 个总剧集、13597 个总帧、2 个总任务、232 个总视频和 1 个总数据块,数据块大小为 1000,帧率为 30 FPS。数据集包含丰富的注释,支持多种学习方式,包括子任务分割、场景级描述、末端执行器方向、速度、加速度分类、抓取器模式、抓取器活动状态、末端执行器模拟姿态、抓取器开启尺度等。数据集组织为训练集,包含剧集 0 到 57。数据集结构遵循 LeRobot 格式,包含视频、状态数据、动作数据和元数据等组件。
创建时间:
2025-11-18
原始信息汇总

AIRBOT_MMK2_egg_storage 数据集概述

📋 数据集基本信息

  • 机器人类型: AIRBOT_MMK2
  • 代码库版本: v2.1
  • 末端执行器类型: five_finger_hand
  • 数据格式: 基于LeRobot的扩展格式,完全兼容LeRobot
  • 许可证: apache-2.0
  • 支持语言: 英语、中文

🏠 场景类型

  • 家庭环境 (home)

🤖 原子动作

  • 抓取 (grasp)
  • 拾取 (pick)
  • 放置 (place)

📊 数据集统计

指标 数值
总片段数 58
总帧数 13597
总任务数 2
总视频数 232
总分块数 1
分块大小 1000
帧率 30 FPS

🎯 任务描述

主要任务

  • 用一只手将一侧的鸡蛋放入碗中,用另一只手将另一侧的鸡蛋放入碗中
  • 用一只手从桌子上拿起鸡蛋并放入蛋盒中

子任务

  1. 异常 (Abnormal)
  2. 结束 (End)
  3. 用左手抓取器抓取鸡蛋
  4. 用右手抓取器抓取鸡蛋
  5. 空值 (null)
  6. 用左手抓取器将鸡蛋放入碗中
  7. 用右手抓取器将鸡蛋放入碗中

🎥 摄像头视图

  • 包含4个摄像头视角

🏷️ 可用标注

子任务标注

  • 子任务分割: 细粒度的子任务分割和标注

场景标注

  • 场景级描述: 语义场景分类和描述

末端执行器标注

  • 方向: 机器人末端执行器运动方向分类
  • 速度: 操作过程中的速度大小分类
  • 加速度: 运动分析的加速度大小分类

抓取器标注

  • 抓取器模式: 抓取器开/闭状态标注
  • 抓取器活动: 活动状态分类(活动/非活动)

附加特征

  • 末端执行器仿真位姿: 仿真空间中末端执行器的6D位姿信息(状态和动作均可用)
  • 抓取器开口尺度: 连续抓取器开口测量(状态和动作均可用)

📂 数据划分

  • 训练集: 片段0-57

📁 数据集结构

数据文件

  • 视频: 包含RGB摄像头观察的压缩视频文件
  • 状态数据: 机器人关节位置、速度和其他状态信息
  • 动作数据: 机器人动作命令和轨迹
  • 元数据: 片段元数据、时间戳和标注

文件组织模式

  • 数据路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
  • 分块: 数据组织为1个分块,每个分块大小为1000

特征架构

视觉观察

  • observation.images.cam_high_rgb: 视频 (FPS: 30, 编码: av1)
  • observation.images.cam_left_wrist_rgb: 视频 (FPS: 30, 编码: av1)
  • observation.images.cam_right_wrist_rgb: 视频 (FPS: 30, 编码: av1)
  • observation.images.cam_third_view: 视频 (FPS: 30, 编码: av1)

状态和动作

  • observation.state: float32 (36维)
  • action: float32 (36维)

时间信息

  • timestamp: float32
  • frame_index: int64
  • episode_index: int64
  • index: int64
  • task_index: int64

标注

  • subtask_annotation: int32
  • scene_annotation: int32

运动特征

  • eef_sim_pose_state: float32 (12维)
  • eef_sim_pose_action: float32 (12维)
  • eef_direction_state: int32 (2维)
  • eef_direction_action: int32 (2维)
  • eef_velocity_state: int32 (2维)
  • eef_velocity_action: int32 (2维)
  • eef_acc_mag_state: int32 (2维)
  • eef_acc_mag_action: int32 (2维)

👥 作者信息

  • 贡献者: RoboCOIN - RoboCOIN团队

🔗 相关链接

  • 主页: https://flagopen.github.io/RoboCOIN/
  • 论文: https://arxiv.org/abs/2511.17441
  • 代码库: https://github.com/FlagOpen/RoboCOIN
  • 项目页面: https://flagopen.github.io/RoboCOIN/
  • 问题反馈: https://github.com/FlagOpen/RoboCOIN/issues

📚 引用信息

bibtex @article{robocoin, title={RoboCOIN: An Open-Sourced Bimanual Robotic Data Collection for Integrated Manipulation}, author={Shihan Wu, Xuecheng Liu, Shaoxuan Xie, Pengwei Wang, Xinghang Li, Bowen Yang, Zhe Li, Kai Zhu, Hongyu Wu, Yiheng Liu, Zhaoye Long, Yue Wang, Chong Liu, Dihan Wang, Ziqiang Ni, Xiang Yang, You Liu, Ruoxuan Feng, Runtian Xu, Lei Zhang, Denghang Huang, Chenghao Jin, Anlan Yin, Xinlong Wang, Zhenguo Sun, Junkai Zhao, Mengfei Du, Mingyu Cao, Xiansheng Chen, Hongyang Cheng, Xiaojie Zhang, Yankai Fu, Ning Chen, Cheng Chi, Sixiang Chen, Huaihai Lyu, Xiaoshuai Hao, Yequan Wang, Bo Lei, Dong Liu, Xi Yang, Yance Jiao, Tengfei Pan, Yunyan Zhang, Songjing Wang, Ziqian Zhang, Xu Liu, Ji Zhang, Caowei Meng, Zhizheng Zhang, Jiyang Gao, Song Wang, Xiaokun Leng, Zhiqiang Xie, Zhenzhen Zhou, Peng Huang, Wu Yang, Yandong Guo, Yichao Zhu, Suibing Zheng, Hao Cheng, Xinmin Ding, Yang Yue, Huanqian Wang, Chi Chen, Jingrui Pang, YuXi Qian, Haoran Geng, Lianli Gao, Haiyuan Li, Bin Fang, Gao Huang, Yaodong Yang, Hao Dong, He Wang, Hang Zhao, Yadong Mu, Di Hu, Hao Zhao, Tiejun Huang, Shanghang Zhang, Yonghua Lin, Zhongyuan Wang and Guocai Yao}, journal={arXiv preprint arXiv:2511.17441}, url = {https://arxiv.org/abs/2511.17441}, year={2025} }

📌 版本信息

  • v1.0.0 (2025-11): 初始发布
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作数据采集领域,AIRBOT_MMK2_egg_storage数据集采用基于LeRobot扩展格式构建,通过AIRBOT_MMK2双手机器人配备五指灵巧手执行鸡蛋存储任务。数据采集涵盖58个完整操作片段,包含13597帧视觉与状态数据,以30帧率记录四路相机视角。数据集采用分块存储结构,将数据组织为单个千帧容量的数据块,通过标准化parquet格式保存机器人关节状态、动作指令及多模态注释信息。
使用方法
研究人员可通过LeRobot兼容接口直接加载该数据集,按照标准路径模式访问分块存储的parquet文件与MP4视频流。训练阶段可利用完整的状态-动作对序列进行策略学习,其中子任务标注支持分层强化学习框架。多视角视觉观测与丰富的运动学注释为模仿学习与行为克隆算法提供支撑,末端执行器位姿数据更适用于基于模型的机器人控制方法验证。
背景与挑战
背景概述
在机器人操作研究领域,双手机器人协同执行精细任务一直是前沿课题。AIRBOT_MMK2_egg_storage数据集由RoboCOIN团队于2025年发布,聚焦于家庭环境中鸡蛋存储场景的双臂协同操作。该数据集基于LeRobot框架构建,采用AIRBOT_MMK2机器人平台与五指灵巧手末端执行器,通过58个任务片段和13597帧多视角视频数据,系统记录了抓取、拾取、放置等原子动作的完整执行过程。其核心研究目标在于解决双手机器人对易碎物体的精细操作难题,为机器人模仿学习与强化学习算法开发提供了高质量基准数据。
当前挑战
该数据集针对双手机器人精细操作领域面临两大挑战:在领域问题层面,鸡蛋作为易碎且形状不规则的物体,要求机器人具备毫米级精度的抓取力度控制与双手运动协调能力,同时需克服视觉遮挡与物体位姿估计的不确定性。在构建过程中,研究团队需同步采集四路高清视频流与36维关节状态数据,确保多模态数据的时空对齐精度;面对五指灵巧手的高自由度控制,如何准确标注末端执行器的运动轨迹与抓握状态,成为数据集质量保障的关键瓶颈。
常用场景
经典使用场景
在机器人操作学习领域,AIRBOT_MMK2_egg_storage数据集通过双手机械臂执行鸡蛋存储任务,为模仿学习与强化学习算法提供了标准测试平台。其多视角视觉观测与精细动作标注体系,使研究者能够系统分析抓取、放置等基础操作在家庭环境中的执行模式,为双臂协调控制研究奠定了数据基础。
解决学术问题
该数据集有效解决了机器人操作中动态物体抓取精度不足、双臂协同控制策略优化等关键学术问题。通过提供包含末端执行器位姿、速度、加速度等多维度运动特征,助力研究者突破复杂物体操作的感知-动作映射瓶颈,推动机器人精细操作理论模型的完善与发展。
实际应用
面向家庭服务机器人场景,该数据集支撑了鸡蛋分拣存储系统的开发与优化。基于真实环境采集的双臂操作数据,可直接应用于厨房自动化设备的行为规划模块,提升易碎物品处理的安全性与效率,为智慧家居场景的机器人部署提供技术验证。
数据集最近研究
最新研究方向
在机器人灵巧操作领域,AIRBOT_MMK2_egg_storage数据集正推动双手机器人协同控制的前沿探索。该数据集通过多视角视觉观测与精细的末端执行器运动标注,为动态抓取策略生成提供了丰富样本。当前研究聚焦于基于多模态感知的双手协调动作规划,结合六维位姿数据与实时运动特征,突破传统单臂操作的局限性。随着家庭服务机器人需求增长,该数据集支持的双手精细操作能力研究,正成为实现复杂场景下物体转移任务的关键技术支撑,为具身智能发展注入新动能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作