pick-cube-wrist-other
收藏Hugging Face2025-07-17 更新2025-07-18 收录
下载链接:
https://huggingface.co/datasets/Trelis/pick-cube-wrist-other
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用LeRobot创建,用于机器人学任务。它包含了8个集段,7619帧,1个任务,16个视频,1个数据块,每个数据块大小为1000。数据集的结构包括动作、观察状态、时间戳、帧索引、集段索引等特征,并且提供了手腕和前视图的视频信息。数据集遵循Apache-2.0许可证。
This dataset was developed using LeRobot for robotics research tasks. It contains 8 episodes, 7619 frames, 1 unique task, 16 videos, and 1 data chunk, with each data chunk having a size of 1000. The dataset structure includes features such as actions, observation states, timestamps, frame indices, and episode indices, and provides video footage from both the wrist-mounted and front viewpoints. This dataset is licensed under the Apache-2.0 license.
提供机构:
Trelis
创建时间:
2025-07-17
原始信息汇总
数据集概述
基本信息
- 名称: pick-cube-wrist-other
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
- 代码库版本: v2.1
数据集结构
- 总集数: 8
- 总帧数: 7619
- 总任务数: 1
- 总视频数: 16
- 总块数: 1
- 块大小: 1000
- 帧率: 30 FPS
- 分割: 训练集 (0:8)
数据文件
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
- 动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
- 观测图像 - 手腕 (observation.images.wrist)
- 数据类型: 视频
- 形状: [480, 640, 3]
- 视频信息: 高度480, 宽度640, 编解码器av1, 像素格式yuv420p, 非深度图, 30 FPS, 3通道, 无音频
- 观测图像 - 正面 (observation.images.front)
- 数据类型: 视频
- 形状: [480, 640, 3]
- 视频信息: 同手腕图像
- 其他特征
- 时间戳 (timestamp): float32, 形状[1]
- 帧索引 (frame_index): int64, 形状[1]
- 集索引 (episode_index): int64, 形状[1]
- 索引 (index): int64, 形状[1]
- 任务索引 (task_index): int64, 形状[1]
引用信息
- 论文: [More Information Needed]
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人操作任务数据采集领域,pick-cube-wrist-other数据集通过LeRobot平台系统化构建。采用so101_follower型机器人执行标准化抓取任务,以30fps的采样频率同步记录多模态数据。数据以分块形式存储于parquet格式文件中,共包含8个完整操作片段,累计7619帧时空对齐的运动序列与视觉观测记录。
特点
该数据集显著特征体现在其多模态融合架构,同时包含六维关节空间动作指令与对应的机器人状态观测。视觉维度提供腕部与前置双视角480×640分辨率视频流,采用AV1编解码技术确保数据高效存储。所有数据帧均配备精确的时间戳与任务索引,形成严格时空对齐的多传感器数据矩阵,为模仿学习算法提供丰富感知上下文。
使用方法
研究者可通过加载parquet数据文件获取结构化操作序列,每个样本包含动作向量、关节状态、双视角图像及元数据。数据集默认按训练集划分全部8个任务片段,支持端到端策略学习与视觉运动对应关系研究。视频数据可通过指定路径访问,建议采用30fps时序一致性处理框架进行行为克隆或强化学习算法验证。
背景与挑战
背景概述
机器人操作任务数据集pick-cube-wrist-other由LeRobot研究团队基于Apache 2.0开源协议构建,专注于机械臂抓取与物体操控领域。该数据集采用so101_follower型机器人平台,通过多视角视觉传感器(包括腕部与前置摄像头)记录六自由度机械臂的关节运动轨迹与视觉观测数据,为模仿学习与强化学习算法提供高质量演示数据。数据集包含8个完整操作序列共7619帧时空对齐的多模态数据,其构建体现了机器人学习社区对真实世界物理交互数据标准化采集的持续探索。
当前挑战
该数据集致力于解决机器人精细操作任务中的动作规划与视觉感知联合优化问题,其核心挑战在于高维连续动作空间与多视角视觉观测的语义对齐。构建过程中需克服多传感器时序同步、机械臂运动轨迹的平滑性保障,以及真实环境中光照变化与物体位姿不确定性带来的数据一致性难题。此外,稀疏奖励环境下的有效行为示范采集与跨模态数据的高效存储结构设计亦是关键挑战。
常用场景
经典使用场景
在机器人操作学习领域,pick-cube-wrist-other数据集为机械臂抓取任务提供了多模态演示数据。该数据集通过腕部摄像头和前置摄像头同步记录机械臂关节状态与视觉信息,典型应用于模仿学习算法的训练与验证。研究者可利用其丰富的时空序列数据,构建从视觉感知到动作执行的端到端策略模型,推动机器人精细操作能力的发展。
实际应用
工业自动化场景中,该数据集可直接应用于精密装配线的物体抓取系统优化。基于数据集训练的模型能够指导机械臂完成电子元件抓取、工件分类等任务,显著提升生产线的柔性化程度。物流分拣领域则可借鉴其多视角视觉处理方案,开发适应复杂光照条件的抓取机器人,有效降低人工分拣成本并提高作业精度。
衍生相关工作
该数据集催生了多项机器人学习领域的创新研究,包括基于时空注意力的抓取预测模型和跨模态表示学习方法。研究者利用其多模态特性开发了联合嵌入架构,实现了视觉观察与动作序列的语义对齐。后续工作进一步扩展了数据集的应用边界,衍生出基于元学习的快速适应框架和仿真到实物的迁移学习方案,推动了机器人操作技能的泛化能力研究。
以上内容由遇见数据集搜集并总结生成



