five

assemble_box_with_phone_stand0430_merged

收藏
Hugging Face2026-04-30 更新2026-04-30 收录
下载链接:
https://huggingface.co/datasets/Xense/assemble_box_with_phone_stand0430_merged
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人操作数据集,使用双Flexiv Rizon4 RT机器人收集,包含116个操作片段和超过112万帧数据。数据集包含多种观测数据,如动作数据(包括左右机械臂的TCP位置和姿态、夹爪位置)、状态观测(与动作数据相同)、以及来自不同视角的图像观测(头部摄像头、左右手腕摄像头、左右触觉传感器图像)。所有图像数据以视频形式存储,分辨率和帧率等信息在数据集中有详细说明。数据以parquet格式存储,视频以mp4格式存储。
提供机构:
Xense
创建时间:
2026-04-30
原始信息汇总

数据集概述

基本信息

  • 数据集名称: assemble_box_with_phone_stand0430_merged
  • 许可证: Apache-2.0
  • 任务类别: 机器人学(robotics)
  • 标签: LeRobot
  • 创建工具: 该数据集使用 LeRobot 创建

数据集规模

  • 总片段数: 116
  • 总帧数: 1,122,623
  • 总任务数: 1
  • 帧率: 30 FPS
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB

数据集划分

  • 训练集: 片段 0 至 115(共116个片段)

机器人类型

  • 机器人型号: bi_flexiv_rizon4_rt(双臂机器人)

特征结构

  • 动作(action):
    • 数据类型: float32
    • 维度: 20
    • 包含:左右TCP位置与姿态(各6维)、左右夹爪位置(各1维)
  • 观测状态(observation.state):
    • 数据类型: float32
    • 维度: 20
    • 包含:与动作相同(左右TCP位置与姿态、左右夹爪位置)
  • 观测图像(observation.images):
    • 头部摄像头(head): 分辨率 480x640,3通道,H.264编码,30 FPS
    • 左腕摄像头(left_wrist): 分辨率 480x640,3通道,H.264编码,30 FPS
    • 右腕摄像头(right_wrist): 分辨率 480x640,3通道,H.264编码,30 FPS
    • 左触觉传感器0(left_tactile_0): 分辨率 400x700,3通道,H.264编码,30 FPS
    • 左触觉传感器1(left_tactile_1): 分辨率 400x700,3通道,H.264编码,30 FPS
    • 右触觉传感器0(right_tactile_0): 分辨率 400x700,3通道,H.264编码,30 FPS
    • 右触觉传感器1(right_tactile_1): 分辨率 400x700,3通道,H.264编码,30 FPS
  • 其他特征:
    • 时间戳(timestamp): float32,形状[1]
    • 帧索引(frame_index): int64,形状[1]
    • 片段索引(episode_index): int64,形状[1]
    • 索引(index): int64,形状[1]
    • 任务索引(task_index): int64,形状[1]

数据存储格式

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作