five

chen4803/pick_place_0422

收藏
Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/chen4803/pick_place_0422
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人领域数据集,包含103个episodes和38798帧数据,视频帧率为30fps。数据集结构包括数据文件、视频文件和多种特征,如动作(6个关节位置)、观测状态(6个关节位置)、前视和腕部视角的图像(480x640分辨率,3通道)、时间戳、帧索引、episode索引等。数据文件总大小为100MB,视频文件总大小为200MB。

This dataset was created using LeRobot for robotics applications, containing 103 episodes and 38798 frames with a video frame rate of 30fps. The dataset structure includes data files, video files, and various features such as actions (6 joint positions), observation states (6 joint positions), front and wrist view images (480x640 resolution, 3 channels), timestamps, frame indices, episode indices, etc. The total size of data files is 100MB, and video files is 200MB.
提供机构:
chen4803
搜集汇总
数据集介绍
main_image_url
构建方式
pick_place_0422数据集基于LeRobot框架构建,通过采集机器人执行拾取与放置任务的演示数据进行创建。数据集包含103个完整轨迹,共计38798帧样本,每个轨迹以30帧/秒的速率记录。数据存储采用分块Parquet格式,分为训练集覆盖全部轨迹。视觉信息通过前置与腕部摄像头以AV1编码的640x480分辨率视频捕获,同时记录六维关节角度动作序列与状态观测值。
特点
该数据集聚焦于单一拾取放置任务,但通过103个高质量演示轨迹提供了丰富的变体。其核心特色在于同时包含高保真视觉输入(两个视角的彩色视频)与精确的机器人控制信号(6自由度动作空间),且所有数据以30Hz频率同步采集。数据经过标准化处理,包含时间戳、帧索引等结构化元数据,便于时序建模与模仿学习研究。
使用方法
数据集可通过LeRobot库的标准化API加载使用,支持直接读取Parquet数据文件与关联的视频片段。研究人员可轻松访问观测图像、状态向量与动作序列,适用于训练行为克隆、逆强化学习等机器人学习算法。数据集默认提供全部轨迹作为训练集,开发者可利用其结构化特征进行数据分割、批次采样或在线训练。
背景与挑战
背景概述
在机器人操作领域,模仿学习作为一种从人类演示中学习复杂技能的有效范式,近年来受到广泛关注。pick_place_0422数据集由chen4803于2023年4月22日创建,基于LeRobot开源框架构建,聚焦于机器人抓取与放置这一基础但关键的操作任务。该数据集由该研究者使用so_follower型机器人采集,包含103个演示片段、共计38798帧,并以30帧/秒的高频记录了两个视角(前方与腕部)的视觉信息及6维关节动作序列。其核心研究问题在于为机器人学习提供高质量的、多模态的演示数据,从而推动基于模仿学习的机器人操作策略研究,尤其在“拾取-放置”这一具有广泛工业与服务应用背景的任务上,为算法验证和模型训练奠定基础。
当前挑战
该数据集所着力解决的领域挑战,在于机器人执行抓取与放置任务时对高精度、强鲁棒的感知与运动控制能力的需求。具体而言,1) 机器人需从视觉输入中准确识别目标物体位姿并规划无碰撞的抓取路径,而环境光照变化与物体多样性增加了难度;2) 动作空间包含6个自由度(肩、肘、腕及夹爪),要求模型在连续动作空间中学习平滑、稳定的运动轨迹。构建过程中亦面临显著挑战:3) 数据采集需通过遥操作或示教方式获取高质量演示,对操作者技能及设备一致性要求极高;4) 多模态数据的同步融合(视频与关节角)及大规模存储(视频文件达200MB)对数据管理与预处理流水线提出严苛考验。
常用场景
经典使用场景
在机器人学习与操控领域,pick_place_0422数据集作为一项专注于抓取与放置任务的精细结构化资源,其经典使用场景主要服务于模仿学习与行为克隆算法的训练与验证。该数据集通过记录so_follower型机器人执行单一任务的103段完整轨迹,囊括了肩部、肘部、腕部及夹爪等6自由度关节的连续动作序列与状态信息,辅以前置和腕部双视角的高清视频流,为构建从视觉观测到动作输出的端到端策略模型提供了理想的数据基础。研究者常基于此类数据,利用条件变分自编码器或扩散策略等生成式架构,学习环境交互中蕴含的隐式控制规律,从而赋予机器人复现精细操作行为的能力。
衍生相关工作
pick_place_0422数据集虽聚焦于单一任务,但其设计范式已催生了一系列延伸研究成果。围绕此数据集,研究者开发了若干改进型的模仿学习算法,例如引入注意力机制的视觉-动作联合建模方法,以提升对非关键帧信息的过滤能力。同时,该数据集被用作数据增强策略的测试基底,衍生出基于时间对比学习或自监督预训练的模型预训练方法,有效提升了策略在未见目标上的零样本迁移表现。此外,其在多任务扩展方面的布局,激励了后续关于共享表示与模块化策略网络的设计探索,为构建通用的机器人操作基础模型积累了宝贵经验。
数据集最近研究
最新研究方向
该数据集聚焦于机器人灵巧操作中的抓取与放置任务,以紧凑的103个高质量示范片段为基石,推动了模仿学习在精细操作领域的前沿探索。基于LeRobot框架构建,其采用多模态视觉-动作联合表征,通过前视与腕部双视角视频流捕捉操作细节,配合六维关节空间状态与动作注释,为研究细粒度技能迁移提供了理想实验平台。在具身智能与机器人基础模型研究热潮中,此类标准化的物体交互数据集对于验证端到端策略的泛化能力至关重要,尤其在强化学习与行为克隆范式下,能够有效支撑从单任务演示到复杂多步操作的知识泛化研究,对于推动可复现的机器人学习方法论具有标杆意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作