five

stacking_block_wrist

收藏
Hugging Face2025-05-25 更新2025-05-26 收录
下载链接:
https://huggingface.co/datasets/masato-ka/stacking_block_wrist
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人学习数据集,包含10个 episodes,共计8974帧,分为1个任务,包含20个视频。数据集特征包括机器人的动作、状态和两个视角的图像信息。所有数据遵循Apache-2.0协议。
创建时间:
2025-05-25
原始信息汇总

数据集概述

基本信息

  • 名称: stacking_block_wrist
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot, so100, tutorial

数据集描述

  • 创建工具: LeRobot
  • 主页:
  • 论文:
  • 引用信息:

数据集结构

  • 代码库版本: v2.1
  • 机器人类型: so100
  • 总集数: 10
  • 总帧数: 8974
  • 总任务数: 1
  • 总视频数: 20
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 分割:
    • 训练集: 0:10

数据路径

  • 数据文件: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  1. 动作 (action)

    • 数据类型: float32
    • 形状: [6]
    • 名称:
      • main_shoulder_pan
      • main_shoulder_lift
      • main_elbow_flex
      • main_wrist_flex
      • main_wrist_roll
      • main_gripper
  2. 观测状态 (observation.state)

    • 数据类型: float32
    • 形状: [6]
    • 名称: 同动作特征
  3. 观测图像 (observation.images)

    • front:
      • 数据类型: video
      • 形状: [480, 640, 3]
      • 视频信息:
        • 高度: 480
        • 宽度: 640
        • 编解码器: av1
        • 像素格式: yuv420p
        • 非深度图
        • 帧率: 30 fps
        • 通道: 3
        • 无音频
    • wrist.right:
      • 同front特征
  4. 其他特征

    • timestamp: float32, 形状 [1]
    • frame_index: int64, 形状 [1]
    • episode_index: int64, 形状 [1]
    • index: int64, 形状 [1]
    • task_index: int64, 形状 [1]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作研究领域,stacking_block_wrist数据集通过LeRobot平台系统性地采集了机械臂执行积木堆叠任务的动态过程。该数据集包含10个完整操作序列,总计8974帧数据,以30fps的采样频率记录。数据以分块形式存储于Parquet文件中,每个数据块包含1000帧,完整覆盖了从初始状态到任务完成的连续操作轨迹。
特点
该数据集的核心特征在于其多模态数据结构的完整性,同时包含六维关节空间动作指令和对应的状态观测值。视觉数据方面提供前视和右腕双视角480x640分辨率视频流,精确记录操作过程中的环境变化。数据标注体系涵盖时间戳、帧索引和任务索引等多维度元数据,为机器人模仿学习研究提供丰富的时空上下文信息。
使用方法
研究者可通过加载Parquet数据文件直接访问结构化操作数据,利用帧索引实现精确的时间序列对齐。动作数据包含肩部平移、肩部抬升、肘部弯曲等六自由度控制指令,与双视角视觉观测形成对应关系。数据集已预分为训练集,支持端到端的行为克隆或强化学习算法验证,视频文件可通过指定路径单独调用进行可视化分析。
背景与挑战
背景概述
在机器人操作技能学习领域,stacking_block_wrist数据集作为LeRobot项目的重要组成部分,专注于机械臂堆叠积木任务的示范数据收集。该数据集通过SO100型机器人平台记录多模态交互数据,包含关节控制指令、视觉观测信息及时间序列标记,为模仿学习与强化学习算法提供真实环境下的训练样本。其结构化存储格式与标准化特征设计,显著提升了机器人技能迁移研究的可复现性。
当前挑战
该数据集致力于解决机器人精细操作中的动作规划与视觉感知协同挑战,尤其在动态环境下的抓取姿态优化与堆叠稳定性控制方面存在显著难度。构建过程中需克服多传感器时序同步、高维动作空间采样效率低、以及真实物理交互中的不确定性等难题,同时需确保视频数据压缩质量与关节轨迹记录的精确对齐。
常用场景
经典使用场景
在机器人操作学习领域,stacking_block_wrist数据集为机械臂堆叠积木任务提供了丰富的多模态数据支持。该数据集通过记录机械臂执行堆叠动作时的关节状态、视觉观测和时间序列信息,为模仿学习和强化学习算法的训练与验证奠定了数据基础。研究人员能够利用这些数据构建端到端的控制策略,模拟真实环境中的物体抓取、定位与堆叠过程,推动机器人精细操作能力的发展。
衍生相关工作
围绕该数据集衍生的研究多集中于多模态融合与跨任务迁移学习。例如,结合前沿的时空注意力机制,研究者开发了能够同时解析腕部与前方视角的视觉Transformer模型,显著提升了动作预测的准确性。另有工作探索了基于本数据预训练的策略模型向其他操作任务(如插拔、旋转)的迁移效果,为构建通用机器人操作范式提供了重要参考。
数据集最近研究
最新研究方向
在机器人操作技能学习领域,stacking_block_wrist数据集为腕部视角下的积木堆叠任务提供了多模态交互数据。该数据集融合了关节状态、视觉观测与动作轨迹,正推动模仿学习与强化学习算法的融合创新。当前研究聚焦于跨视角视觉表征迁移、精细动作序列生成等方向,旨在提升机械臂在复杂场景下的泛化能力。随着开源机器人社区对标准化数据集的迫切需求,这类高质量示范数据正成为端到端策略训练与仿真到现实迁移的关键基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作