PickPlace

Hugging Face2025-08-06 更新2025-08-07 收录

下载链接：

https://huggingface.co/datasets/adungus/PickPlace

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，包含了机器人任务的详细信息。数据集结构在info.json文件中描述，包括机器人类型、总剧集数、总帧数、任务数和视频数。数据特征包括动作、观察状态、顶部和侧面图像等信息。该数据集遵循Apache-2.0许可。

创建时间：

2025-07-31

原始信息汇总

数据集概述

基本信息

名称: PickPlace
许可证: Apache-2.0
任务类别: 机器人学 (robotics)
相关标签: LeRobot

数据集描述

创建工具: 使用 LeRobot 创建
主页: 无更多信息
论文: 无更多信息

数据集结构

数据文件格式: Parquet
配置文件: default，数据文件路径为 data/*/*.parquet

元数据信息 (`meta/info.json`)

代码库版本: v2.1
机器人类型: so100_follower
总集数: 1
总帧数: 268
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率 (FPS): 30
训练集划分: 0:1

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images.top 和 observation.images.side)
- 数据类型: video
- 形状: [720, 1280, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 720
  - 宽度: 1280
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30
  - 通道数: 3
  - 包含音频: false
其他特征
- 时间戳 (timestamp): float32, 形状 [1]
- 帧索引 (frame_index): int64, 形状 [1]
- 集索引 (episode_index): int64, 形状 [1]
- 索引 (index): int64, 形状 [1]
- 任务索引 (task_index): int64, 形状 [1]

引用

BibTeX: 无更多信息

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，PickPlace数据集依托LeRobot框架构建而成，采用实际机械臂执行抓取放置操作并同步记录多模态数据。数据采集过程涉及SO100型机器人执行单次任务序列，通过30帧/秒的双视角视觉系统捕捉720p高清图像，并同步记录六维关节角度动作与状态数据。所有数据经标准化处理后以分块Parquet格式存储，确保时序对齐与高效存取。

特点

该数据集突出表现为多模态异构数据的深度融合，包含顶部与侧部双视角视觉流、六自由度机械臂连续动作轨迹及精确的时间戳索引。每个数据帧均配备高维关节空间状态描述，视频流采用AV1编码压缩技术兼顾质量与效率。数据集结构设计遵循机器人学习范式，提供完整的动作-观测对序列，适用于模仿学习与强化学习算法的训练需求。

使用方法

研究者可通过加载Parquet数据文件直接获取结构化观测-动作序列，利用帧索引实现多模态数据的时间同步。视觉数据支持逐帧解码或视频流处理，关节状态数据可直接用于动力学模型训练。数据集预留任务索引字段支持特定子任务筛选，建议采用滑动窗口策略构建训练样本以充分利用时序相关性。

背景与挑战

背景概述

PickPlace数据集作为机器人操作学习领域的重要资源，由LeRobot团队基于Apache 2.0开源协议构建，专注于机械臂抓取与放置任务的智能控制研究。该数据集通过so100_follower型机器人采集多模态交互数据，包含268帧高精度关节状态记录与双视角视觉信息，为机器人模仿学习与强化学习算法提供了真实世界的训练基准。其结构化数据格式与时空对齐特性显著推动了机器人动作生成模型的标准化进程，成为学术界与工业界评估操作性能的关键基准之一。

当前挑战

该数据集核心挑战在于解决高维连续动作空间中的精确轨迹规划问题，需协调六自由度机械臂运动与抓取器操作的时序一致性。构建过程中面临多传感器数据同步的技术难题，包括720p双视角视频与关节角度数据的毫秒级对齐，以及不同材质物体抓取时的力学反馈模拟。此外，有限的任务多样性（仅包含1个任务场景）和样本规模（单次任务录制）对模型的泛化能力提出了严峻考验，需通过数据增强与迁移学习弥补原始数据覆盖度的不足。

常用场景

经典使用场景

在机器人操作学习领域，PickPlace数据集为机械臂抓取与放置任务提供了标准化的训练基准。该数据集通过双视角视频流与六维关节动作数据的同步记录，完整呈现了SO100型机械臂执行物体操控任务的全过程，为模仿学习与行为克隆算法提供了多模态示范数据。研究者可基于该数据集训练端到端的视觉运动策略网络，使机器人能够从视觉输入直接生成关节控制指令。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，包括基于时空注意力的行为克隆架构、多视角视觉特征融合方法以及示范数据增强技术。相关研究通过引入动态时间规整算法改进了动作序列的对齐精度，并发展了基于物理约束的动作优化框架。这些工作显著提升了模仿学习在复杂操作任务中的泛化能力，为后续的大规模机器人学习数据集建设提供了重要参考范式。

数据集最近研究