jeongsu-moon/pickandplace
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/jeongsu-moon/pickandplace
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人领域。数据集包含60个episodes,共17214帧,帧率为30fps。数据以parquet和mp4格式存储,包含动作、状态观察、图像观察等特征。具体特征包括:1) 动作特征:包含6个关节位置信息;2) 状态观察特征:同样包含6个关节位置信息;3) 图像观察特征:包含前置和顶部摄像头拍摄的480x640分辨率视频;4) 其他特征:时间戳、帧索引、episode索引等。数据集总大小为100MB(数据文件)和200MB(视频文件)。
This dataset was created by LeRobot and is primarily used in the robotics domain. It contains 60 episodes with a total of 17,214 frames at 30fps. The data is stored in parquet and mp4 formats and includes features such as actions, state observations, and image observations. Specific features include: 1) Action features: containing position information for 6 joints; 2) State observation features: also containing position information for 6 joints; 3) Image observation features: including front and top camera videos with 480x640 resolution; 4) Other features: timestamp, frame index, episode index, etc. The total size of the dataset is 100MB (data files) and 200MB (video files).
提供机构:
jeongsu-moon
搜集汇总
数据集介绍

构建方式
该数据集基于LeRobot框架构建,采用SO-Follower机器人平台,通过遥操作方式采集了60个操作片段,总帧数达17214帧,涵盖单一抓取与放置任务。数据以parquet格式存储,按1000帧分块组织,视频流则采用h264编码的MP4文件保存,确保了数据的高效存取与视频的视觉一致性。
特点
数据集包含高保真度的多模态观测数据,包括6维关节位置状态(动作空间与状态空间一致)以及前视和顶视两路640×480分辨率的RGB视频。所有数据以30fps的采样频率同步记录,并附有精细的时间戳与帧索引,为模仿学习与行为克隆研究提供了时空对齐的完整轨迹。
使用方法
借助LeRobot工具链,用户可通过统一的API加载数据集,直接获取动作序列、状态观测与图像帧。数据集已预设训练集划分(前60个片段),支持直接用于策略网络训练。同时,HuggingFace上的可视化界面允许在线预览运动轨迹与视频,降低了数据探索的门槛。
背景与挑战
背景概述
在机器人操作领域,模仿学习与行为克隆技术的发展高度依赖于高质量、精细化的演示数据集。由Jeongsu Moon等研究人员基于LeRobot框架创建的PickAndPlace数据集,发布于Apache-2.0许可之下,专注于单任务抓取与放置操作。该数据集利用so_follower机器人平台,以30帧每秒的速率记录了60个完整的操作回合,共计17214帧,并通过前置与俯视双视角相机捕获了480×640像素的视觉观测数据,同时完整保存了六维关节空间的动作与状态信息。这一数据集为研究机器人在结构化环境中执行精准抓取与放置任务提供了标准化、可复现的基准,推动了机器人操作学习从理论验证向实际部署的过渡,尤其对低样本学习与跨工况泛化研究具有重要参考价值。
当前挑战
该数据集核心解决的领域挑战是机器人单任务模仿学习中数据效率与行为泛化之间的鸿沟。尽管提供了精细的动作与状态标注,但仅包含1种任务、60个示范回合,限制了策略对未见过物体位置、光照变化及干扰工况的适应能力。在构建过程中,数据采集依赖于人工遥操作或远程操控,难以保证不同回合间动作轨迹的一致性与最优性;同时,高帧率视频与密集状态序列的同步存储带来了数据管理与质量审核的复杂性,尤其是在自动化标注与异常检测方面,当前缺乏有效的校验机制来剔除次优或失败的示范数据。
常用场景
经典使用场景
在机器人学习与操控领域,pickandplace数据集专为模仿学习与行为克隆任务而生,经典应用聚焦于机械臂的抓取与放置(pick-and-place)操作。该数据集包含60个完整演示片段,以30帧/秒的高速采样频率记录机械臂六关节的运动轨迹与末端夹爪状态,并通过前置与俯视两个视角的同步RGB视频提供丰富的视觉观测。研究者可借助这些高质量的状态-动作配对数据,训练策略网络以端到端方式复现熟练的操作行为,从而构建具备精准定位与柔顺抓取能力的智能操控系统。
实际应用
在实际工业与生产场景中,基于pickandplace数据集训练的操控策略可无缝迁移至装配流水线上的零件分拣、电子产品元器件的精密贴装以及仓储物流中的物品整理等任务。机械臂借助前置与俯视摄像头的协同感知,能自主识别目标物体的位置与姿态,并执行稳定抓取与定点放置操作。该数据驱动的方案显著降低了传统编程调参的复杂度,使得非专家用户也能通过少量示教快速部署柔性生产线,在提升作业一致性的同时大幅缩短产线的换型周期。
衍生相关工作
围绕pickandplace数据集,学界已衍生出多项创新性工作,包括利用扩散策略(Diffusion Policy)对高维动作序列进行建模、引入视觉语言模型实现基于自然语言指令的灵活操控,以及开发基于跨域模仿学习的快速自适应方法。此外,该数据集常被作为基准用于对比不同网络架构(如Transformer与卷积网络)在机器人操控任务中的性能表现,并催生了针对数据增广技术、逆动力学模型预训练以及分层强化学习框架的深入研究,有力推动了开源机器人学习生态的繁荣。
以上内容由遇见数据集搜集并总结生成



