cube_tower_circle

Hugging Face2025-05-30 更新2025-05-31 收录

下载链接：

https://huggingface.co/datasets/Matlef/cube_tower_circle

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot创建的机器人数据集，包含多个剧集，每个剧集包含多个视频和帧，用于机器人操作相关的任务。

创建时间：

2025-05-29

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学 (robotics)
标签: LeRobot
创建工具: LeRobot

数据集结构

数据文件格式: Parquet
配置名称: default
数据文件路径: data/*/*.parquet

元数据信息

代码库版本: v2.1
机器人类型: so100
总集数: 85
总帧数: 101447
总任务数: 1
总视频数: 255
总块数: 1
块大小: 1000
帧率: 30 fps
数据分割: 训练集 (train): 0:85

数据路径

数据文件路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作 (action)

数据类型: float32
形状: [6]
名称:
- main_shoulder_pan
- main_shoulder_lift
- main_elbow_flex
- main_wrist_flex
- main_wrist_roll
- main_gripper

观测状态 (observation.state)

数据类型: float32
形状: [6]
名称: 同动作特征

观测图像 (observation.images)

phone

数据类型: video
形状: [480, 640, 3]
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 fps
- 通道数: 3
- 无音频

cam_claw

数据类型: video
形状: [480, 640, 3]
视频信息: 同phone

webcam

数据类型: video
形状: [480, 640, 3]
视频信息: 同phone

其他特征

timestamp: float32, 形状 [1]
frame_index: int64, 形状 [1]
episode_index: int64, 形状 [1]
index: int64, 形状 [1]
task_index: int64, 形状 [1]

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，cube_tower_circle数据集通过LeRobot平台精心构建，采用SO100型机器人执行任务。数据集包含85个完整操作序列，总计101447帧视频数据，以30fps的帧率记录。数据以分块形式存储于Parquet文件中，每个文件包含机械臂关节角度、夹爪状态等6维动作向量，以及来自三个不同视角的480x640分辨率视频流，全面捕捉操作过程中的多维状态信息。

使用方法

研究者可通过加载Parquet文件直接访问结构化数据，视频文件则按分块目录组织。数据集已预分为训练集，包含全部85个操作序列。典型应用场景包括机器人操作策略的监督学习、多视角视觉表征学习等。使用前需配置相应视频解码环境，建议结合LeRobot代码库进行数据加载和预处理，以充分利用其多模态特性。

背景与挑战

背景概述

cube_tower_circle数据集由LeRobot团队构建，专注于机器人操作任务的研究。该数据集通过记录机械臂在搭建立方体塔和圆形结构时的多模态数据，为机器人学习领域提供了宝贵的实验资源。数据集包含85个完整任务片段，超过10万帧的高清视频和6自由度机械臂动作数据，采用Apache 2.0开源协议发布。其核心价值在于为机器人动作规划与视觉伺服控制研究提供了真实场景下的基准测试数据，推动了机器人操作技能的智能化发展。

当前挑战

该数据集面临的领域挑战主要体现在复杂物体操作的精确控制与多模态感知融合方面。机械臂在堆叠不规则物体时需要解决抓取力度控制、空间定位精度和防碰撞等关键问题。数据构建过程中，研究人员需克服多摄像头同步校准、大规模动作数据标注、以及真实环境干扰等工程难题。视频数据的实时采集与存储也带来了计算资源消耗与数据处理效率的平衡挑战。

常用场景

经典使用场景

在机器人控制与视觉感知领域，cube_tower_circle数据集通过记录机械臂操作立方体堆叠任务的完整过程，为模仿学习算法提供了丰富的多模态训练数据。其包含的关节角度、末端执行器状态以及多视角视频流，特别适合用于研究机械臂在复杂操作任务中的运动规划与视觉伺服控制问题。

解决学术问题

该数据集有效解决了机器人操作任务中样本效率低下的关键问题，通过真实世界采集的连续操作序列，填补了仿真到现实迁移研究的空白。其精确标注的机械臂状态数据和同步的多视角视觉信息，为研究动作-观察对齐、跨模态表征学习等前沿课题提供了可靠基准。

实际应用

工业自动化领域可基于该数据集开发智能分拣系统，其记录的抓取-放置操作范式可直接迁移到物流仓储场景。教育机器人领域则利用其清晰的视觉-动作对应关系，构建机器人操作技能的教学演示系统，显著降低机器人编程的门槛。

数据集最近研究