piperx_pick_and_place_v1_3

Hugging Face2026-04-23 更新2026-04-24 收录

下载链接：

https://huggingface.co/datasets/csjmacmi/piperx_pick_and_place_v1_3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学相关的数据集，使用LeRobot创建。数据集包含11个episodes，总计17681帧数据，适用于双机械臂（bi_piperx_follower）的控制任务。数据以parquet格式存储，总数据量约为100MB，视频文件约为200MB。数据集包含多种特征：动作（14个关节位置）、观测状态（14个关节位置）、来自三个摄像头（左腕、右腕、右前）的视频观测（480x640分辨率，30fps，AV1编码），以及补充信息（如干预标志、策略ID等）。视频数据为非深度图，无音频。数据集适用于机器人控制、视觉-动作联合建模等任务，采用Apache-2.0许可证。

创建时间：

2026-04-23

原始信息汇总

数据集概述

项目	内容
数据集名称	piperx_pick_and_place_v1_3
许可证	Apache-2.0
任务类别	机器人学（robotics）
创建工具	LeRobot
机器人类型	bi_piperx_follower（双臂PiperX跟随机器人）
总片段数	11
总帧数	17,681
总任务数	1
帧率	30 FPS
数据文件大小	100 MB
视频文件大小	200 MB

数据划分

训练集（train）：片段索引 0:11（即所有11个片段均用于训练）

特征说明

特征名称	数据类型	形状	说明
action	float32	(14,)	14维动作向量，包含左右各6个关节位置及1个夹爪位置
observation.state	float32	(14,)	14维观测状态，结构与动作相同
observation.images.left_wrist	video	(480, 640, 3)	左手腕摄像头视频，AV1编码，30 FPS
observation.images.right_wrist	video	(480, 640, 3)	右手腕摄像头视频，AV1编码，30 FPS
observation.images.right_front	video	(480, 640, 3)	右前方摄像头视频，AV1编码，30 FPS
complementary_info.policy_action	float32	(14,)	辅助信息：策略动作
complementary_info.is_intervention	float32	(1,)	辅助信息：是否人为干预
complementary_info.state	float32	(1,)	辅助信息：状态
complementary_info.collector_policy_id	string	(1,)	辅助信息：采集策略ID
timestamp	float32	(1,)	时间戳
frame_index	int64	(1,)	帧索引
episode_index	int64	(1,)	片段索引
index	int64	(1,)	全局索引
task_index	int64	(1,)	任务索引

数据存储结构

数据文件路径：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
配置文件：meta/info.json

搜集汇总

数据集介绍

构建方式

piperx_pick_and_place_v1_3数据集基于LeRobot框架构建，专注于机器人操作任务的记录。数据集包含11个完整轨迹片段，总计17681帧数据，采样频率为30帧每秒。数据采集使用了双PiperX跟随机器人（bi_piperx_follower），通过遥操作或预设策略收集执行拾取与放置任务时的动作序列与环境反馈。数据以分块形式存储，每块1000帧，动作与状态信息均以14维浮点向量表示，涵盖左右手臂各6个关节及夹爪位姿，同时记录三个视角的视觉影像（左腕、右腕、右前），并附有策略干预标识、采集策略编号等互补信息，确保数据可追溯性与策略分析便利性。

特点

该数据集的核心特点在于其多维异构信息的高度集成。动作与观察状态共享相同的14维关节空间表征，便于构建统一的策略映射。视觉观测包含三个640×480分辨率、30帧每秒的AV1编码视频流，分别从左右腕部及右前视角捕捉操作细节，为多模态学习提供丰富视觉线索。互补信息字段中，policy_action与state字段可对比预设策略与实际执行差异，is_intervention标记用于区分自主与人为干预片段，collector_policy_id则记录采集策略来源，这些设计使得数据集在模仿学习、策略评估及人机协作研究场景中展现出独特价值。

使用方法

使用该数据集时，推荐通过LeRobot库加载与处理。用户可依据parquet文件与视频文件的路径结构（data/chunk-xxx/file-xxx.parquet及videos/{video_key}/chunk-xxx/file-xxx.mp4）直接读取数据。数据集已预设训练集划分（前11个轨迹作为训练），可结合LeRobot的DataModule进行批量加载与增强。对于模仿学习任务，可将observation.state与observation.images作为输入，action作为目标输出；互补信息字段则可用于策略干预分析或离线评估。由于数据格式规范，亦支持用户自定义流程，通过PyTorch或TensorFlow构建数据管道，在机器人操作策略训练中灵活调用。

背景与挑战

背景概述

piperx_pick_and_place_v1_3数据集由Hugging Face社区基于LeRobot框架创建，旨在为双臂机器人操作任务提供标准化的训练与评估资源。该数据集聚焦于双PiperX机械臂的抓取与放置操作，记录了11个完整回合、总计17681帧的高频动作序列，包含左、右腕部及右前方三个视角的同步视频与14维关节状态信息。作为机器人学习领域的重要补充，该数据集弥补了双臂协调操作场景中开源数据稀缺的现状，为研究模仿学习、行为克隆及机器人自主决策提供了基础性素材，推动了机器人从单一操作向双臂协同的泛化能力提升。

当前挑战

该数据集所解决的领域核心挑战在于双臂机器人在精细操作任务中的协调控制与视觉反馈融合。传统单臂数据集无法覆盖双臂同时运动时的碰撞规避、力位协同等复杂性，而piperx_pick_and_place_v1_3通过提供多视角视觉与关节角度联合数据，为模型学习双臂动态约束关系创造了条件。构建过程中面临的挑战包括：高精度关节状态与视频帧的时序同步（30fps下误差需小于33毫秒），以及通过遥操作采集演示数据时人类操作者的示教一致性控制——仅11个回合的数据量虽能验证方法可行性，但数据规模与多样性仍然制约着模型在不可见场景中的泛化表现。

常用场景

经典使用场景

在机器人操作学习领域，piperx_pick_and_place_v1_3数据集为双臂协同的抓取与放置任务提供了高质量示范数据。该数据集基于Bi-PiperX双臂机器人平台，包含11个完整回合、超过17681帧的观测与动作序列，记录了左右各六自由度机械臂及夹爪的精确关节位置，同时辅以左腕、右腕及右前方多视角视觉图像。经典使用场景在于训练模仿学习或强化学习策略，通过状态-动作映射使机器人复现复杂的拾取与放置操作，尤其适用于研究双臂协调动作规划与闭环控制。

衍生相关工作

围绕此数据集衍生出多项开创性工作，例如基于扩散策略的双臂协同轨迹生成方法，以及融合视觉与力觉的鲁棒抓取算法。研究者常将piperx_pick_and_place_v1_3作为基准，评估多种模仿学习框架在双臂任务中的表现，并据此提出改进的注意力机制或多模态融合架构。这些工作不仅丰富了机器人学习领域的理论体系，还催生了如LeRobot等开放工具的发展，推动了数据驱动型机器人研究范式的普及。

数据集最近研究