cell2_20260516_mm_coffee_prep_20260517_001658
收藏Hugging Face2026-05-17 更新2026-05-17 收录
下载链接:
https://huggingface.co/datasets/nodogoro/cell2_20260516_mm_coffee_prep_20260517_001658
下载链接
链接失效反馈官方服务:
资源简介:
这是一个使用LeRobot工具创建的双机械臂机器人操作数据集,专门用于机器人学习任务。数据集包含7个完整的情节(episodes),总计5429帧数据,采样频率为30fps。机器人类型为starpilot_yam_gripper,数据特征包括:14维动作向量(控制两个机械臂的末端执行器位置、旋转和夹爪宽度)、32维状态观测(包含两个机械臂的编码器角度、IMU数据、末端位姿和夹爪状态)、以及来自多个视角的视频数据(包括左右腕部摄像头的RGB和深度图像,以及两个基座摄像头的RGB图像)。所有视频数据采用h264编码,分辨率分别为480x640和768x1024。数据集采用Apache 2.0许可证,数据以parquet格式存储,总数据量约300MB(数据文件100MB,视频文件200MB)。
This is a dual-arm robot manipulation dataset created using the LeRobot tool, specifically designed for robot learning tasks. The dataset contains 7 complete episodes, totaling 5429 frames with a sampling frequency of 30fps. The robot type is starpilot_yam_gripper, and the data features include: a 14-dimensional action vector (controlling the end-effector position, rotation, and gripper width of both arms), a 32-dimensional state observation (including encoder angles, IMU data, end-pose, and gripper status for both arms), and video data from multiple perspectives (including RGB and depth images from left and right wrist cameras, as well as RGB images from two base cameras). All video data is encoded in h264, with resolutions of 480x640 and 768x1024 respectively. The dataset is licensed under Apache 2.0, stored in parquet format, with a total data volume of approximately 300MB (100MB for data files and 200MB for video files).
提供机构:
nodogoro
创建时间:
2026-05-17
原始信息汇总
数据集概述
该数据集是使用 LeRobot 框架创建的机器人操作数据集,专注于咖啡准备任务。
基本信息
- 许可协议: Apache-2.0
- 任务类别: 机器人技术 (Robotics)
- 机器人类型: starpilot_yam_gripper
- 数据集版本: v3.0
数据规模
| 指标 | 数值 |
|---|---|
| 总片段数 | 7 |
| 总帧数 | 5,429 |
| 总任务数 | 1 |
| 帧率 (FPS) | 30 |
| 数据文件大小 | 100 MB |
| 视频文件大小 | 200 MB |
| 训练集 | 片段的 0 至 7 (全部) |
数据结构
数据集包含多个特征,分为以下几类:
- 动作 (Action): 包含 14 个维度的浮点数,定义了双臂 (arm1, arm2) 的位置 (x, y, z)、旋转 (rx, ry, rz) 以及夹爪宽度 (grip_width)。
- 状态观测 (Observation State): 包含 32 个维度的浮点数,记录了双臂的编码器角度、IMU 测量值、位姿 (位置 + 四元数)、夹爪状态等。
- 图像观测 (Observation Images): 包含 6 个摄像头视角的 RGB 视频流,分辨率为 480x640 或 768x1024,编码为 H.264,帧率 30 FPS。
left_wrist_0_camera_rgb_image(左腕相机,RGB)left_wrist_0_camera_rgb_image_depth(左腕相机,深度图)right_wrist_0_camera_rgb_image(右腕相机,RGB)right_wrist_0_camera_rgb_image_depth(右腕相机,深度图)base_0_camera_rgb_image(底座相机0,RGB)base_1_camera_rgb_image(底座相机1,RGB)
- 元数据: 包含时间戳 (timestamp)、帧索引 (frame_index)、片段索引 (episode_index)、全局索引 (index) 和任务索引 (task_index)。
数据文件组织
- 数据路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet(Parquet 格式) - 视频路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4(MP4 格式) - 分块大小: 1000



