assemble_box_with_phone_stand0430_merged
收藏Hugging Face2026-04-30 更新2026-04-30 收录
下载链接:
https://huggingface.co/datasets/Xense/assemble_box_with_phone_stand0430_merged
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人操作数据集,使用双Flexiv Rizon4 RT机器人收集,包含116个操作片段和超过112万帧数据。数据集包含多种观测数据,如动作数据(包括左右机械臂的TCP位置和姿态、夹爪位置)、状态观测(与动作数据相同)、以及来自不同视角的图像观测(头部摄像头、左右手腕摄像头、左右触觉传感器图像)。所有图像数据以视频形式存储,分辨率和帧率等信息在数据集中有详细说明。数据以parquet格式存储,视频以mp4格式存储。
提供机构:
Xense
创建时间:
2026-04-30
原始信息汇总
数据集概述
基本信息
- 数据集名称: assemble_box_with_phone_stand0430_merged
- 许可证: Apache-2.0
- 任务类别: 机器人学(robotics)
- 标签: LeRobot
- 创建工具: 该数据集使用 LeRobot 创建
数据集规模
- 总片段数: 116
- 总帧数: 1,122,623
- 总任务数: 1
- 帧率: 30 FPS
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
数据集划分
- 训练集: 片段 0 至 115(共116个片段)
机器人类型
- 机器人型号: bi_flexiv_rizon4_rt(双臂机器人)
特征结构
- 动作(action):
- 数据类型: float32
- 维度: 20
- 包含:左右TCP位置与姿态(各6维)、左右夹爪位置(各1维)
- 观测状态(observation.state):
- 数据类型: float32
- 维度: 20
- 包含:与动作相同(左右TCP位置与姿态、左右夹爪位置)
- 观测图像(observation.images):
- 头部摄像头(head): 分辨率 480x640,3通道,H.264编码,30 FPS
- 左腕摄像头(left_wrist): 分辨率 480x640,3通道,H.264编码,30 FPS
- 右腕摄像头(right_wrist): 分辨率 480x640,3通道,H.264编码,30 FPS
- 左触觉传感器0(left_tactile_0): 分辨率 400x700,3通道,H.264编码,30 FPS
- 左触觉传感器1(left_tactile_1): 分辨率 400x700,3通道,H.264编码,30 FPS
- 右触觉传感器0(right_tactile_0): 分辨率 400x700,3通道,H.264编码,30 FPS
- 右触觉传感器1(right_tactile_1): 分辨率 400x700,3通道,H.264编码,30 FPS
- 其他特征:
- 时间戳(timestamp): float32,形状[1]
- 帧索引(frame_index): int64,形状[1]
- 片段索引(episode_index): int64,形状[1]
- 索引(index): int64,形状[1]
- 任务索引(task_index): int64,形状[1]
数据存储格式
- 数据文件路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4



