five

robocasa_spatial_camrandom_depthmap_pretrain_atomic_CloseFridgeDrawer

收藏
Hugging Face2026-04-15 更新2026-04-15 收录
下载链接:
https://huggingface.co/datasets/kimz1121/robocasa_spatial_camrandom_depthmap_pretrain_atomic_CloseFridgeDrawer
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot框架创建的,专注于机器人技术领域。数据集包含111个episodes,14946帧,涉及1个任务。数据包括动作、观测状态(如基础位置、末端执行器位置等)、图像观测(如左右视角、手眼视角等)以及深度图。视频和数据文件分别占用200MB和100MB空间,帧率为20fps。数据集的结构详细描述了各种特征的数据类型和形状,如动作的12个浮点数值、观测状态的16个浮点数值以及多个256x256x3的视频图像。
提供机构:
kimz1121
创建时间:
2026-04-15
原始信息汇总

数据集概述

基本信息

  • 数据集名称: kimz1121/robocasa_spatial_camrandom_depthmap_pretrain_atomic_CloseFridgeDrawer
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache 2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模与结构

  • 总任务数: 1
  • 总情节数: 111
  • 总帧数: 14946
  • 帧率: 20 FPS
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 数据格式: Parquet
  • 数据存储路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频存储路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据划分: 全部数据(第0至111个情节)用于训练。

机器人信息

  • 机器人类型: PandaOmron
  • 代码库版本: v3.0

数据特征

数据集包含以下主要特征:

动作

  • 数据类型: float32
  • 形状: [12]
  • 描述: 包含机器人基座、末端执行器和夹爪的控制指令。具体字段为:
    • base_x, base_y, base_rot, base_torso
    • control_mode
    • ee_x, ee_y, ee_z, ee_rx, ee_ry, ee_rz
    • gripper_close

观测状态

  • 数据类型: float32
  • 形状: [16]
  • 描述: 包含机器人基座和末端执行器的位姿状态。具体字段为:
    • base_x, base_y, base_z, base_qx, base_qy, base_qz, base_qw
    • ee_rel_x, ee_rel_y, ee_rel_z, ee_rel_qx, ee_rel_qy, ee_rel_qz, ee_rel_qw
    • gripper_left, gripper_right

观测图像(RGB)

包含三个视角的RGB视频观测,每个视频的属性如下:

  • 数据类型: video
  • 形状: [256, 256, 3] (高度,宽度,通道)
  • 编码: H.264
  • 像素格式: yuv420p
  • 帧率: 20 FPS
  • 音频: 无
  • 深度图: 否
  • 具体视角:
    • observation.images.robot0_agentview_left
    • observation.images.robot0_agentview_right
    • observation.images.robot0_eye_in_hand

观测图像(深度图)

包含三个视角的深度图视频观测,其形状、编码、帧率等属性与RGB视频观测完全相同。

  • 具体视角:
    • observation.images.robot0_agentview_left_depthmap
    • observation.images.robot0_agentview_right_depthmap
    • observation.images.robot0_eye_in_hand_depthmap

相机内参

  • 数据类型: float32
  • 形状: [3, 3]
  • 描述: 相机内参矩阵。
  • 对应视角:
    • observation.intrinsic.robot0_agentview_left
    • observation.intrinsic.robot0_agentview_right
    • observation.intrinsic.robot0_eye_in_hand

相机外参

  • 数据类型: float32
  • 形状: [4, 4]
  • 描述: 相机外参矩阵。
  • 对应视角:
    • observation.extrinsic.robot0_agentview_left
    • observation.extrinsic.robot0_agentview_right
    • observation.extrinsic.robot0_eye_in_hand

索引与时间戳

  • 时间戳: timestamp (float32, 形状 [1])
  • 帧索引: frame_index (int64, 形状 [1])
  • 情节索引: episode_index (int64, 形状 [1])
  • 数据索引: index (int64, 形状 [1])
  • 任务索引: task_index (int64, 形状 [1])

可视化

可通过以下链接可视化此数据集:https://huggingface.co/spaces/lerobot/visualize_dataset?path=kimz1121/robocasa_spatial_camrandom_depthmap_pretrain_atomic_CloseFridgeDrawer

引用信息

  • 主页: [信息缺失]
  • 论文: [信息缺失]
  • BibTeX引用: [信息缺失]
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作