five

cube_tower_circle

收藏
Hugging Face2025-05-30 更新2025-05-31 收录
下载链接:
https://huggingface.co/datasets/Matlef/cube_tower_circle
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个使用LeRobot创建的机器人数据集,包含多个剧集,每个剧集包含多个视频和帧,用于机器人操作相关的任务。
创建时间:
2025-05-29
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot
  • 创建工具: LeRobot

数据集结构

  • 数据文件格式: Parquet
  • 配置名称: default
  • 数据文件路径: data/*/*.parquet

元数据信息

  • 代码库版本: v2.1
  • 机器人类型: so100
  • 总集数: 85
  • 总帧数: 101447
  • 总任务数: 1
  • 总视频数: 255
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 数据分割: 训练集 (train): 0:85

数据路径

  • 数据文件路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作 (action)

  • 数据类型: float32
  • 形状: [6]
  • 名称:
    • main_shoulder_pan
    • main_shoulder_lift
    • main_elbow_flex
    • main_wrist_flex
    • main_wrist_roll
    • main_gripper

观测状态 (observation.state)

  • 数据类型: float32
  • 形状: [6]
  • 名称: 同动作特征

观测图像 (observation.images)

phone

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 编解码器: av1
    • 像素格式: yuv420p
    • 非深度图
    • 帧率: 30 fps
    • 通道数: 3
    • 无音频

cam_claw

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息: 同phone

webcam

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息: 同phone

其他特征

  • timestamp: float32, 形状 [1]
  • frame_index: int64, 形状 [1]
  • episode_index: int64, 形状 [1]
  • index: int64, 形状 [1]
  • task_index: int64, 形状 [1]

引用信息

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作领域,cube_tower_circle数据集通过LeRobot平台精心构建,采用SO100型机器人执行任务。数据集包含85个完整操作序列,总计101447帧视频数据,以30fps的帧率记录。数据以分块形式存储于Parquet文件中,每个文件包含机械臂关节角度、夹爪状态等6维动作向量,以及来自三个不同视角的480x640分辨率视频流,全面捕捉操作过程中的多维状态信息。
使用方法
研究者可通过加载Parquet文件直接访问结构化数据,视频文件则按分块目录组织。数据集已预分为训练集,包含全部85个操作序列。典型应用场景包括机器人操作策略的监督学习、多视角视觉表征学习等。使用前需配置相应视频解码环境,建议结合LeRobot代码库进行数据加载和预处理,以充分利用其多模态特性。
背景与挑战
背景概述
cube_tower_circle数据集由LeRobot团队构建,专注于机器人操作任务的研究。该数据集通过记录机械臂在搭建立方体塔和圆形结构时的多模态数据,为机器人学习领域提供了宝贵的实验资源。数据集包含85个完整任务片段,超过10万帧的高清视频和6自由度机械臂动作数据,采用Apache 2.0开源协议发布。其核心价值在于为机器人动作规划与视觉伺服控制研究提供了真实场景下的基准测试数据,推动了机器人操作技能的智能化发展。
当前挑战
该数据集面临的领域挑战主要体现在复杂物体操作的精确控制与多模态感知融合方面。机械臂在堆叠不规则物体时需要解决抓取力度控制、空间定位精度和防碰撞等关键问题。数据构建过程中,研究人员需克服多摄像头同步校准、大规模动作数据标注、以及真实环境干扰等工程难题。视频数据的实时采集与存储也带来了计算资源消耗与数据处理效率的平衡挑战。
常用场景
经典使用场景
在机器人控制与视觉感知领域,cube_tower_circle数据集通过记录机械臂操作立方体堆叠任务的完整过程,为模仿学习算法提供了丰富的多模态训练数据。其包含的关节角度、末端执行器状态以及多视角视频流,特别适合用于研究机械臂在复杂操作任务中的运动规划与视觉伺服控制问题。
解决学术问题
该数据集有效解决了机器人操作任务中样本效率低下的关键问题,通过真实世界采集的连续操作序列,填补了仿真到现实迁移研究的空白。其精确标注的机械臂状态数据和同步的多视角视觉信息,为研究动作-观察对齐、跨模态表征学习等前沿课题提供了可靠基准。
实际应用
工业自动化领域可基于该数据集开发智能分拣系统,其记录的抓取-放置操作范式可直接迁移到物流仓储场景。教育机器人领域则利用其清晰的视觉-动作对应关系,构建机器人操作技能的教学演示系统,显著降低机器人编程的门槛。
数据集最近研究
最新研究方向
在机器人操作任务领域,cube_tower_circle数据集以其丰富的多视角视频数据和精确的机械臂动作记录,为研究复杂环境下的物体堆叠与排列提供了重要支持。近期研究聚焦于利用该数据集训练端到端的深度强化学习模型,探索在动态环境中实现更高精度的物体操控。结合LeRobot平台的开源特性,研究者们正致力于开发跨模态感知算法,通过融合视觉观测与关节状态数据,提升机械臂在非结构化环境中的自适应能力。这一方向与当前机器人学习领域的热点——样本效率提升与泛化能力强化密切相关,为工业自动化和家庭服务机器人的实际应用奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作