five

robocasa_spatial_camrandom_depthmap_trunc_pretrain_atomic_CloseElectricKettleLid

收藏
Hugging Face2026-04-15 更新2026-04-15 收录
下载链接:
https://huggingface.co/datasets/kimz1121/robocasa_spatial_camrandom_depthmap_trunc_pretrain_atomic_CloseElectricKettleLid
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,包含机器人操作相关的数据。数据集结构详细,包括动作、观察状态、图像(包括左右视角和手眼视角的RGB及深度图)、内参和外参矩阵等多种特征。数据集中包含102个episodes,7530帧,1个任务,使用PandaOmron机器人采集,帧率为20fps。数据以parquet格式存储,视频以mp4格式存储。
提供机构:
kimz1121
创建时间:
2026-04-15
原始信息汇总

数据集概述

基本信息

  • 数据集名称: robocasa_spatial_camrandom_depthmap_trunc_pretrain_atomic_CloseElectricKettleLid
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集结构

规模统计

  • 总任务数: 1
  • 总情节数: 102
  • 总帧数: 7530
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 20 FPS
  • 数据分割: 训练集 (0:102)

数据特征

动作 (action)

  • 数据类型: float32
  • 形状: [12]
  • 维度名称: base_x, base_y, base_rot, base_torso, control_mode, ee_x, ee_y, ee_z, ee_rx, ee_ry, ee_rz, gripper_close

观测状态 (observation.state)

  • 数据类型: float32
  • 形状: [16]
  • 维度名称: base_x, base_y, base_z, base_qx, base_qy, base_qz, base_qw, ee_rel_x, ee_rel_y, ee_rel_z, ee_rel_qx, ee_rel_qy, ee_rel_qz, ee_rel_qw, gripper_left, gripper_right

图像观测

包含以下六个视频流特征,每个特征具有相同规格:

  • observation.images.robot0_agentview_left
  • observation.images.robot0_agentview_right
  • observation.images.robot0_eye_in_hand
  • observation.images.robot0_agentview_left_depthmap
  • observation.images.robot0_agentview_right_depthmap
  • observation.images.robot0_eye_in_hand_depthmap

视频规格:

  • 数据类型: video
  • 形状: [256, 256, 3] (高度, 宽度, 通道)
  • 视频高度: 256
  • 视频宽度: 256
  • 视频编解码器: h264
  • 像素格式: yuv420p
  • 是否为深度图: false
  • 视频帧率: 20
  • 视频通道数: 3
  • 包含音频: false

相机内参矩阵 (observation.intrinsic)

包含以下三个特征,每个特征具有相同规格:

  • observation.intrinsic.robot0_agentview_left
  • observation.intrinsic.robot0_agentview_right
  • observation.intrinsic.robot0_eye_in_hand
  • 数据类型: float32
  • 形状: [3, 3]
  • 名称: intrinsic_matrix

相机外参矩阵 (observation.extrinsic)

包含以下三个特征,每个特征具有相同规格:

  • observation.extrinsic.robot0_agentview_left
  • observation.extrinsic.robot0_agentview_right
  • observation.extrinsic.robot0_eye_in_hand
  • 数据类型: float32
  • 形状: [4, 4]
  • 名称: extrinsic_matrix

索引与时间戳

  • timestamp: float32, 形状 [1]
  • frame_index: int64, 形状 [1]
  • episode_index: int64, 形状 [1]
  • index: int64, 形状 [1]
  • task_index: int64, 形状 [1]

文件结构

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

技术信息

  • 代码库版本: v3.0
  • 机器人类型: PandaOmron

可视化

可通过以下地址可视化数据集:https://huggingface.co/spaces/lerobot/visualize_dataset?path=kimz1121/robocasa_spatial_camrandom_depthmap_trunc_pretrain_atomic_CloseElectricKettleLid

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX引用: 未提供
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作