zeuzei/p17

Name: zeuzei/p17
Creator: zeuzei
Published: 2026-05-01 09:38:54
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/zeuzei/p17

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人领域数据集。数据集包含10个片段，总计5980帧，涉及1个任务。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集包含多种特征，如动作（6个关节位置）、观察状态（6个关节位置）、顶部和手腕视角的图像（480x640分辨率，3通道）、时间戳、帧索引、任务索引等。机器人类型为so_follower。

This dataset was created using LeRobot for robotics applications. It contains 10 episodes with a total of 5980 frames and 1 task. The data is stored in parquet format, with total data files size of 100MB and video files size of 200MB at 30fps. The dataset includes various features such as actions (6 joint positions), observation states (6 joint positions), top and wrist view images (480x640 resolution, 3 channels), timestamps, frame indices, task indices, etc. The robot type is so_follower.

提供机构：

zeuzei

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集是驱动算法进步的基石。p17数据集正是基于LeRobot框架构建而成，旨在为机器人操作任务提供标准化的训练资源。该数据集通过遥操作方式，利用so_follower机器人平台采集，共记录了10个完整回合（episode）的演示数据，总计包含5980帧图像与状态信息。数据以Parquet格式存储结构化信息，并采用分块（chunk）组织方式，每块容纳1000帧；同时视觉观测数据以AV1编码的MP4视频文件保存，支持30帧/秒的流畅回放。整个数据集严格遵循Apache-2.0开源协议，确保可自由使用与分发。

特点

p17数据集兼具多维时序与高保真视觉特性，为模仿学习与强化学习提供丰富感知基础。其动作与状态空间均为6维浮点向量，对应机器人的肩部、肘部、腕部及夹爪关节位置，实现了精确的运动描述。视觉模块包含顶置与腕部两路摄像头，均采集480x640像素的RGB图像，覆盖全局与局部视角，利于场景理解与精细操作。数据集内所有回合均针对单一任务设计，便于聚焦算法评估；同时每帧附带时间戳与索引信息，支持时序模型与序列化训练管道的无缝集成。

使用方法

研究人员可通过LeRobot生态高效调用p17数据集。借助HuggingFace上的可视化工具，能直接浏览各回合的演示视频与状态变化。在代码层面，利用LeRobot提供的Dataset类可加载Parquet文件与视频数据，自动对齐动作、状态及图像序列，适用于训练基于视觉的模仿学习模型或离线强化学习策略。数据集已预划分训练集（全部10回合），无需额外分割；若需扩展，可配合LeRobot的重放与评估模块，在仿真或真实环境中验证模型性能，快速推动机器人技能学习研究的迭代与落地。

背景与挑战

背景概述

p17数据集由研究者zeuzei基于LeRobot框架创建，旨在为机器人操控任务提供标准化的训练与评估资源。该数据集聚焦于单任务学习场景，利用SO-Follower机器人平台采集了10个完整轨迹，共计5980帧的高频（30FPS）视觉与运动状态数据。通过同步记录肩部、肘部等6自由度关节动作及顶部与腕部双视角视频，p17为模仿学习与机器人控制算法提供了精细化的多模态输入，推动了机器人数据驱动方法在精细操作领域的发展。

当前挑战

机器人操控领域面临的核心挑战在于如何从有限示范中泛化至未知环境与物体变体，p17数据集仅含10个轨迹，难以覆盖复杂任务所需的变异性和鲁棒性。构建过程中，精确同步高频视觉与关节状态信号、校准多摄像头坐标系并压缩视频存储（采用AV1编码）均构成显著技术障碍，此外，单一机器人平台与固定任务设置限制了跨形态知识迁移，亟需更大规模、多场景的数据积累以支撑通用操控策略的学习。

常用场景

经典使用场景

p17数据集是面向机器人模仿学习研究而构建的高质量演示数据集，基于LeRobot框架采集自so_follower型机器人平台。该数据集的核心应用场景在于训练机器人从视觉观测中学习精细操作技能，尤其针对6自由度机械臂与夹爪的协同控制。通过记录机器人执行单一任务时的关节状态序列、动作指令以及多视角视觉信息——包括俯视摄像头与腕部摄像头的视频流，该数据集为端到端的模仿学习算法提供了完整的训练素材。研究者常利用p17探索视觉-运动联合表征的建模方法，或将其作为行为克隆、逆强化学习等范式的基础基准。其结构化的parquet数据格式与标准化的特征命名，也便于融入现有的机器人学习流水线中进行快速迭代验证。

实际应用

从实际应用视角审视，p17数据集直接服务于工业与服务场景中机器人敏捷部署的需求。在电子装配、精密抓取等生产线上，该数据集所录制的示范轨迹可用于训练机器人快速复现操作员的高效动作。在家庭服务领域，基于p17学习的策略能够使机械臂更自然地完成物品传递、工具使用等交互任务。数据集的双目视觉配置（顶部与腕部）贴近实际监控场景，有助于算法在真实光照与背景噪声下维持良好性能。此外，p17采用的Apache-2.0许可协议降低了商业化使用门槛，企业可基于此数据集进行仿真到现实的迁移学习验证，从而加速机器人技能从实验室到流水线的落地进程。

衍生相关工作

围绕p17数据集已衍生出若干具有影响力的研究工作。基于其标准化框架，研究者开发了多种针对so_follower机器人的预训练视觉-运动模型，例如利用对比学习从多视角视频中提取通用操作特征。部分工作将其与LeRobot生态中的其他数据集结合，构建了跨本体、跨任务的元学习基准，系统评估了不同网络架构在有限示范数据下的泛化能力。在模仿学习前沿，p17被用于验证扩散策略在机器人操作中的有效性，探索了从高斯噪声中逐步恢复动作序列的可行性。此外，该数据集还启发了关于演示质量自动评估与数据增强策略的设计，推动形成了从数据采集到策略部署的完整研究闭环。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集