cell1_20260523_mohammed_groceries_packing_20260523_224342
收藏Hugging Face2026-05-24 更新2026-05-24 收录
下载链接:
https://huggingface.co/datasets/nodogoro/cell1_20260523_mohammed_groceries_packing_20260523_224342
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人操作数据集,使用LeRobot工具创建,专注于双机械臂(starpilot_yam_gripper类型)的抓取和包装任务。数据集包含5个完整的情节(episodes),总计3355帧,涉及1个具体任务。数据以parquet文件格式存储,视频文件以mp4格式存储,帧率为30fps。数据集的特征包括:动作数据(14维,涵盖两个机械臂的位置、旋转和夹爪宽度)、状态观察数据(32维,包括编码器角度、IMU加速度和角速度、姿态四元数、夹爪开合状态和距离)、多视角图像数据(来自左腕、右腕和基座摄像头的RGB和深度图像,分辨率分别为480x640和768x1024),以及时间戳、帧索引、情节索引等元数据。该数据集适用于机器人学习、强化学习和计算机视觉研究,特别是用于模拟真实世界中的物体操作场景。
This dataset is a robotic manipulation dataset created using the LeRobot tool, focusing on grasping and packing tasks with dual robotic arms (starpilot_yam_gripper type). It contains 5 complete episodes, totaling 3355 frames, and involves 1 specific task. The data is stored in parquet file format, with video files in mp4 format at a frame rate of 30fps. The dataset features include: action data (14-dimensional, covering position, rotation, and gripper width of both arms), state observation data (32-dimensional, including encoder angles, IMU acceleration and angular velocity, pose quaternions, gripper open/close status and distance), multi-view image data (RGB and depth images from left wrist, right wrist, and base cameras, with resolutions of 480x640 and 768x1024), and metadata such as timestamps, frame indices, and episode indices. This dataset is suitable for robotics learning, reinforcement learning, and computer vision research, particularly for simulating real-world object manipulation scenarios.
提供机构:
nodogoro
创建时间:
2026-05-24
原始信息汇总
数据集概览
- 名称: cell1_20260523_mohammed_groceries_packing_20260523_224342
- 许可协议: Apache-2.0
- 任务类别: 机器人技术 (Robotics)
- 标签: LeRobot
- 创建工具: LeRobot
数据集规模
- 总片段数 (Episodes): 5
- 总帧数 (Frames): 3355
- 总任务数: 1
- 帧率 (FPS): 30
- 数据文件大小: 100 MB
- 视频文件大小: 200 MB
- 数据分块大小: 1000 帧/块
- 数据切分: 全部片段 (0-4) 用于训练
机器人信息
- 机器人类型: starpilot_yam_gripper
数据特征
- 动作 (Action): 14 维 float32 向量,包含双臂 (arm1, arm2) 的 x/y/z 位置、旋转 (rx, ry, rz) 以及夹爪宽度 (grip_width)。
- 观测状态 (observation.state): 32 维 float32 向量,包含双臂的编码器角度、IMU 数据、位姿 (位置 + 四元数)、夹爪是否打开及夹爪距离。
- 观测图像 (observation.images):
- 左腕相机 RGB 图像: 480x640 像素,3 通道,H264 编码,30 FPS。
- 左腕相机 RGB 深度图像: 480x640 像素,3 通道,H264 编码,30 FPS。
- 右腕相机 RGB 图像: 480x640 像素,3 通道,H264 编码,30 FPS。
- 右腕相机 RGB 深度图像: 480x640 像素,3 通道,H264 编码,30 FPS。
- 基础相机 0 RGB 图像: 480x640 像素,3 通道,H264 编码,30 FPS。
- 基础相机 1 RGB 图像: 768x1024 像素,3 通道,H264 编码,30 FPS。
- 时间戳 (timestamp): float32,单值。
- 帧索引 (frame_index): int64,单值。
- 片段索引 (episode_index): int64,单值。
- 全局索引 (index): int64,单值。
- 任务索引 (task_index): int64,单值。
数据存储路径
- 数据文件:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4



