PickPlace
收藏Hugging Face2025-08-06 更新2025-08-07 收录
下载链接:
https://huggingface.co/datasets/adungus/PickPlace
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,包含了机器人任务的详细信息。数据集结构在info.json文件中描述,包括机器人类型、总剧集数、总帧数、任务数和视频数。数据特征包括动作、观察状态、顶部和侧面图像等信息。该数据集遵循Apache-2.0许可。
创建时间:
2025-07-31
原始信息汇总
数据集概述
基本信息
- 名称: PickPlace
- 许可证: Apache-2.0
- 任务类别: 机器人学 (robotics)
- 相关标签: LeRobot
数据集描述
- 创建工具: 使用 LeRobot 创建
- 主页: 无更多信息
- 论文: 无更多信息
数据集结构
- 数据文件格式: Parquet
- 配置文件:
default,数据文件路径为data/*/*.parquet
元数据信息 (meta/info.json)
- 代码库版本: v2.1
- 机器人类型: so100_follower
- 总集数: 1
- 总帧数: 268
- 总任务数: 1
- 总视频数: 2
- 总块数: 1
- 块大小: 1000
- 帧率 (FPS): 30
- 训练集划分:
0:1
数据路径
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
-
动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
-
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
-
观测图像 (observation.images.top 和 observation.images.side)
- 数据类型: video
- 形状: [720, 1280, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 720
- 宽度: 1280
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false
-
其他特征
- 时间戳 (timestamp): float32, 形状 [1]
- 帧索引 (frame_index): int64, 形状 [1]
- 集索引 (episode_index): int64, 形状 [1]
- 索引 (index): int64, 形状 [1]
- 任务索引 (task_index): int64, 形状 [1]
引用
- BibTeX: 无更多信息
搜集汇总
数据集介绍

构建方式
在机器人操作任务研究领域,PickPlace数据集依托LeRobot框架构建而成,采用实际机械臂执行抓取放置操作并同步记录多模态数据。数据采集过程涉及SO100型机器人执行单次任务序列,通过30帧/秒的双视角视觉系统捕捉720p高清图像,并同步记录六维关节角度动作与状态数据。所有数据经标准化处理后以分块Parquet格式存储,确保时序对齐与高效存取。
特点
该数据集突出表现为多模态异构数据的深度融合,包含顶部与侧部双视角视觉流、六自由度机械臂连续动作轨迹及精确的时间戳索引。每个数据帧均配备高维关节空间状态描述,视频流采用AV1编码压缩技术兼顾质量与效率。数据集结构设计遵循机器人学习范式,提供完整的动作-观测对序列,适用于模仿学习与强化学习算法的训练需求。
使用方法
研究者可通过加载Parquet数据文件直接获取结构化观测-动作序列,利用帧索引实现多模态数据的时间同步。视觉数据支持逐帧解码或视频流处理,关节状态数据可直接用于动力学模型训练。数据集预留任务索引字段支持特定子任务筛选,建议采用滑动窗口策略构建训练样本以充分利用时序相关性。
背景与挑战
背景概述
PickPlace数据集作为机器人操作学习领域的重要资源,由LeRobot团队基于Apache 2.0开源协议构建,专注于机械臂抓取与放置任务的智能控制研究。该数据集通过so100_follower型机器人采集多模态交互数据,包含268帧高精度关节状态记录与双视角视觉信息,为机器人模仿学习与强化学习算法提供了真实世界的训练基准。其结构化数据格式与时空对齐特性显著推动了机器人动作生成模型的标准化进程,成为学术界与工业界评估操作性能的关键基准之一。
当前挑战
该数据集核心挑战在于解决高维连续动作空间中的精确轨迹规划问题,需协调六自由度机械臂运动与抓取器操作的时序一致性。构建过程中面临多传感器数据同步的技术难题,包括720p双视角视频与关节角度数据的毫秒级对齐,以及不同材质物体抓取时的力学反馈模拟。此外,有限的任务多样性(仅包含1个任务场景)和样本规模(单次任务录制)对模型的泛化能力提出了严峻考验,需通过数据增强与迁移学习弥补原始数据覆盖度的不足。
常用场景
经典使用场景
在机器人操作学习领域,PickPlace数据集为机械臂抓取与放置任务提供了标准化的训练基准。该数据集通过双视角视频流与六维关节动作数据的同步记录,完整呈现了SO100型机械臂执行物体操控任务的全过程,为模仿学习与行为克隆算法提供了多模态示范数据。研究者可基于该数据集训练端到端的视觉运动策略网络,使机器人能够从视觉输入直接生成关节控制指令。
衍生相关工作
该数据集催生了多项机器人学习领域的创新研究,包括基于时空注意力的行为克隆架构、多视角视觉特征融合方法以及示范数据增强技术。相关研究通过引入动态时间规整算法改进了动作序列的对齐精度,并发展了基于物理约束的动作优化框架。这些工作显著提升了模仿学习在复杂操作任务中的泛化能力,为后续的大规模机器人学习数据集建设提供了重要参考范式。
数据集最近研究
最新研究方向
在机器人操作领域,PickPlace数据集作为LeRobot生态系统的重要组成部分,正推动模仿学习与多模态感知的融合研究。该数据集通过顶部与侧视角的双目视觉序列,结合六自由度机械臂的精确动作记录,为三维空间中的抓取策略生成提供了丰富的时空关联数据。当前研究热点集中于利用此类多视角视频数据训练端到端的视觉运动策略网络,探索在少量示教样本下的泛化能力。随着具身智能概念的兴起,该数据集在家庭服务机器人精细操作任务中展现出重要价值,为克服现实环境中动态干扰和物体多样性挑战提供了基准测试平台。
以上内容由遇见数据集搜集并总结生成



