zeuzei/p15

Name: zeuzei/p15
Creator: zeuzei
Published: 2026-05-01 09:25:45
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/zeuzei/p15

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，属于机器人领域。数据集包含10个episodes，共5980帧，帧率为30fps的视频数据。数据以parquet格式存储，并包含视频文件。数据集的特征包括动作（如shoulder_pan.pos等）、观测状态（如shoulder_pan.pos等）、顶部和腕部图像（480x640分辨率，RGB通道）、时间戳、帧索引、episode索引等。数据集未提供主页、论文和引用信息。

This dataset was created by LeRobot and belongs to the robotics domain. It contains 10 episodes, totaling 5980 frames, with a frame rate of 30fps. The data is stored in parquet format and includes video files. The dataset features include actions (e.g., shoulder_pan.pos, etc.), observation states (e.g., shoulder_pan.pos, etc.), top and wrist images (480x640 resolution, RGB channels), timestamps, frame indices, episode indices, etc. The dataset does not provide homepage, paper, or citation information.

提供机构：

zeuzei

搜集汇总

数据集介绍

构建方式

p15数据集基于LeRobot框架构建，旨在为机器人操作任务提供标准化训练数据。数据通过遥操作方式，由操作者控制SO-50机械臂的六个自由度（包括肩部旋转、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转及夹爪开合）进行采集。每个数据样本包含动作指令、机械臂关节状态、自上而下与腕部视角的同步视频流（分辨率为480×640像素，帧率30fps），以及时间戳、帧索引、任务索引等元信息。全部数据被划分为10个演示片段，共计5980帧，存储为Parquet格式的区块化文件，便于高效加载与分布式处理。

使用方法

使用p15数据集时，推荐通过LeRobot库进行加载与预处理。用户可调用`lerobot.Dataset`接口直接读取Parquet文件与关联的MP4视频，自动对齐动作、状态与图像序列。典型应用场景包括端到端模仿学习训练，例如利用卷积神经网络或Transformer模型，以双视角图像为输入，预测6维关节动作。数据集的区块化存储机制支持流式读取，适合大规模迭代训练。研究者亦可自定义采样策略，从10个演示片段中提取特定片段或进行数据增强，如随机裁剪与色彩抖动，以提升模型泛化能力。

背景与挑战

背景概述

在机器人学习领域，模仿学习与基于演示的策略迁移正成为推动技能习得的关键范式。p15数据集由研究人员利用LeRobot框架构建，依托so_follower机器人平台采集，收录了10个演示轨迹、共计5980帧的高频运动数据，涵盖肩部、肘部、腕部及夹爪等6维关节空间的精确动作与状态信息，并辅以俯视与腕部双视角的工业级视频记录。该数据集聚焦于单一操作任务的精细化建模，尝试为机器人从人类示教中掌握连续控制策略提供标准化训练材料，其清晰的传感器对齐与时间戳标注架构，为后续基于视觉-运动联合表征的算法研究奠定了坚实基础。

当前挑战

p15数据集面临的研究挑战首先体现在领域问题的复杂性上：机器人操作任务中，高维连续动作空间与视觉观测之间的非线性映射关系，对模仿学习算法的泛化能力与抗噪声鲁棒性构成严峻考验。在数据集构建过程中，技术瓶颈同样显著——受限于so_follower机械臂的物理精度与传感器采样一致性，仅10个演示片段难以覆盖真实场景中的状态分布稀疏性；同时，双摄像头在480×640分辨率下以AV1格式压缩存储视频，虽兼顾画质与存储效率，但编码失真与帧率波动可能导致运动流特征提取的不稳定性，进而影响策略的零样本迁移表现。

常用场景

经典使用场景

在机器人学习与具身智能领域，p15数据集专为模仿学习中的动作预测与状态估计任务而设计。该数据集包含10个完整轨迹，共计5980帧高保真时序数据，覆盖单一操作任务。每个轨迹同步记录6自由度关节动作指令、对应状态向量以及来自顶部和腕部双视角的视觉流（640×480分辨率，30帧/秒）。研究者以此为基础可构建端到端的视觉-动作映射模型，训练机器人从像素观测中直接学习复现精细操作策略。典型实验设置将数据按轨迹分割为训练集，并采用预定义的时间步长进行序列建模。

解决学术问题

p15数据集的核心价值在于攻克模仿学习中数据稀缺性与高维状态耦合两大瓶颈。传统方法需依赖手工特征或环境模型，而该数据集提供紧凑的六维动作-状态对与多模态视觉-运动匹配，使研究可聚焦于因果推理与少样本泛化。它推动了机器人领域在复杂物理交互下学习鲁棒策略的进程，尤其解决了从人类演示中高效提取可迁移技能的问题。该数据集的标准化格式还促进了不同算法（如行为克隆、逆强化学习）的公平对比，为验证长期时序依赖建模提供了可靠基准。

实际应用

在工业场景中，p15数据集可支撑精密装配、物料分拣等任务的机器人自动化部署。借助其记录的夹爪与关节运动轨迹，开发者能训练机械臂在未知光照或工件姿态下稳定完成零件拾取与插接。在服务机器人领域，双摄像头视角模拟了人眼-手协同的视觉反馈，可应用于厨具操作、医疗辅助等需要精细控制的场合。此外，该数据集的低延迟特征（30Hz采样率）适合部署至边缘计算设备，支持实时策略推理。

数据集最近研究