AI2_Alphabot_2_open_microwave
收藏数据集概述:AI2_Alphabot_2_open_microwave
1. 基本信息
- 数据集名称:AI2_Alphabot_2_open_microwave
- 语言:英语
- 许可协议:Apache-2.0
- 数据集大小:7.91 GB
- 总帧数:337,551
- 总集数(Episodes):392
- 帧率(FPS):30
2. 任务描述
- 主要任务:用一只手按下按钮打开微波炉门,用另一只手关闭微波炉门。
- 操作类型:固定双臂操作(fixed_dual_arm)
- 环境类型:真实世界(real_world)
- 子任务数量:1
- 原子动作:按压(press)、推(push)
3. 场景与对象
- 场景类型:餐饮->餐厅(Catering->Restaurant)
- 操作对象:白色微波炉(microwave oven(white))
4. 机器人配置
- 机器人名称:AI2_Alphabot_2
- 末端执行器类型:二指末端执行器(two_finger_end_effector)
- 遥操作类型:VR控制器(vr_controller)
- 代码库版本:v2.1
5. 传感器与相机
- 传感器数量:4个RGB相机
- 相机列表与参数:
相机名称 数据类型 分辨率 编码格式 像素格式 cam_front_chest_rgb video 640x480 av1 yuv420p cam_front_head_rgb video 640x480 av1 yuv420p cam_left_wrist_rgb video 640x480 av1 yuv420p cam_right_wrist_rgb video 640x480 av1 yuv420p - 坐标系定义:右手坐标系(right-hand-frame)
- 量纲与单位:
- 关节旋转:弧度(radian)
- 末端执行器旋转:弧度(radian)
- 末端执行器平移:米(meter)
6. 数据统计
| 指标 | 数值 |
|---|---|
| 总集数 | 392 |
| 总帧数 | 337,551 |
| 总任务数 | 1 |
| 总视频数 | 1,568 |
| 总块数 | 1 |
| 块大小 | 1,000 |
| 状态维度 | 34 |
| 动作维度 | 34 |
| 相机视角数 | 4 |
| 数据集大小 | 7.91 GB |
7. 数据划分
- 训练集:第0集至第391集(episodes 0:391)
8. 数据格式与组织结构
-
数据格式:基于LeRobot扩展格式,完全兼容LeRobot。
-
文件结构:
AI2_Alphabot_2_open_microwave_0_qced_hardlink/ |-- annotations/ # 注释文件(JSONL格式) | |-- eef_acc_mag_annotation.jsonl | |-- eef_direction_annotation.jsonl | |-- eef_velocity_annotation.jsonl | |-- gripper_activity_annotation.jsonl | |-- gripper_mode_annotation.jsonl |-- data/ # 数据文件(Parquet格式) | |-- chunk-000/ # 包含所有episode的Parquet文件 |-- meta/ # 元数据文件 | |-- episodes.jsonl | |-- episodes_stats.jsonl | |-- info.json | |-- tasks.jsonl |-- videos/ # 视频文件(压缩格式) | |-- chunk-000/ | |-- observation.images.cam_front_chest_rgb/ | |-- observation.images.cam_front_head_rgb/ | |-- observation.images.cam_left_wrist_rgb/ | |-- observation.images.cam_right_wrist_rgb/ |-- info.yaml # 配置信息文件
-
数据路径模式:
data/chunk-{id}/episode_{id}.parquet -
视频路径模式:
videos/chunk-{id}/observation.images.cam_front_chest_rgb/episode_{id}.mp{id}
9. 特征(Features)
- 观测:
- RGB图像:4个摄像头(cam_front_chest_rgb, cam_front_head_rgb, cam_left_wrist_rgb, cam_right_wrist_rgb),分辨率480×640×3,类型为video。
- 状态(state):34维float32,包含双臂关节位置、末端执行器位置及旋转、夹爪开合状态、颈部关节、躯干关节等。
- 动作(action):34维float32,与状态维度对应。
- 元数据:timestamp, frame_index, episode_index, index, task_index。
- 额外特征:
- gripper_open_scale_state / action(2维夹爪开合比例)
- eef_sim_pose_state / action(12维仿真末端执行器位姿)
- eef_direction_state / action(2维末端执行器方向)
- eef_velocity_state / action(2维末端执行器速度)
- eef_acc_mag_state / action(2维末端执行器加速度幅值)
- gripper_mode_state / action(2维夹爪模式)
- gripper_activity_state / action(2维夹爪活动)
10. 可用注释(Annotations)
- eef_acc_mag_annotation.jsonl
- eef_direction_annotation.jsonl
- eef_velocity_annotation.jsonl
- gripper_activity_annotation.jsonl
- gripper_mode_annotation.jsonl
11. 数据集标签
- RoboCOIN
- LeRobot
12. 贡献者与引用
-
贡献者:北京智源人工智能研究院(BAAI)RoboCOIN团队。
-
论文引用:如需引用,请使用以下BibTeX: bibtex @article{robocoin, title={RoboCOIN: An Open-Sourced Bimanual Robotic Data Collection for Integrated Manipulation}, author={Shihan Wu, Xuecheng Liu, Shaoxuan Xie, ...}, journal={arXiv preprint arXiv:2511.17441}, year={2025} }
-
相关链接:
- 主页:https://flagopen.github.io/RoboCOIN/
- 论文:https://arxiv.org/abs/2511.17441
- 代码仓库:https://github.com/FlagOpen/RoboCOIN



