vpdt_n120_ms3c_nlgp_tr
收藏Hugging Face2026-03-06 更新2026-03-06 收录
下载链接:
https://huggingface.co/datasets/Ealin10/vpdt_n120_ms3c_nlgp_tr
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,是一个机器人学相关数据集,包含多模态数据(状态向量和视觉数据)。数据集结构包括观察状态、动作、图像(RGB和深度)等多种特征。具体包含90个episodes,20377帧,仅包含训练数据分割。数据文件格式为parquet,视频文件格式为mp4,帧率为30fps。观察状态和动作的特征维度均为16,分别代表左右机械臂的位置、四元数旋转和夹持器状态。图像数据包括RGB和深度图像,分辨率均为224x224。
提供机构:
Ealin10
创建时间:
2026-03-06
原始信息汇总
数据集概述
基本信息
- 数据集名称: vpdt_n120_ms3c_nlgp_tr
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可协议: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集规模
- 总情节数: 90
- 总帧数: 20377
- 总任务数: 1
- 数据块大小: 1000
- 数据文件大小: 100 MB
- 视频文件大小: 200 MB
- 帧率: 30 FPS
- 数据分割: 训练集 (0:90)
数据结构与特征
数据以Parquet文件格式存储,路径模式为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。
视频以MP4文件格式存储,路径模式为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4。
主要特征字段
-
observation.state
- 数据类型: float32
- 形状: [16]
- 描述: 机器人状态,包括左/右机械臂的位置(px, py, pz)、四元数姿态(qx, qy, qz, qw)和夹爪状态(grip)。
-
action
- 数据类型: float32
- 形状: [16]
- 描述: 机器人动作,对应状态各维度的变化量(d_前缀)。
-
observation.images.rgb
- 数据类型: video
- 形状: [3, 224, 224]
- 描述: RGB图像,编码为AV1视频,分辨率224x224,30 FPS,无音频。
-
observation.images.rgb_side
- 数据类型: video
- 形状: [3, 224, 224]
- 描述: 侧视RGB图像,编码为AV1视频,分辨率224x224,30 FPS,无音频。
-
observation.images.depth
- 数据类型: video
- 形状: [3, 224, 224]
- 描述: 深度图像,编码为AV1视频,分辨率224x224,30 FPS,无音频。
-
observation.images.depth_side
- 数据类型: video
- 形状: [3, 224, 224]
- 描述: 侧视深度图像,编码为AV1视频,分辨率224x224,30 FPS,无音频。
-
stage
- 数据类型: int64
- 形状: [1]
- 描述: 阶段标识。
-
gpoints
- 数据类型: float32
- 形状: [2, 3]
- 描述: 目标点坐标,维度为[左右, xyz]。
-
gpoints_valid
- 数据类型: float32
- 形状: [1]
- 描述: 目标点有效性标识。
-
eLR
- 数据类型: float32
- 形状: [6]
- 描述: 左右机械臂的误差向量(lx, ly, lz, rx, ry, rz)。
-
timestamp
- 数据类型: float32
- 形状: [1]
- 描述: 时间戳。
-
frame_index
- 数据类型: int64
- 形状: [1]
- 描述: 帧索引。
-
episode_index
- 数据类型: int64
- 形状: [1]
- 描述: 情节索引。
-
index
- 数据类型: int64
- 形状: [1]
- 描述: 数据索引。
-
task_index
- 数据类型: int64
- 形状: [1]
- 描述: 任务索引。
其他信息
- 代码库版本: v3.0
- 机器人类型: 未指定
- 主页: 未提供
- 论文: 未提供
- 引用信息: 未提供



