zeuzei/p13
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/zeuzei/p13
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人领域。数据集包含10个episodes,5582帧,1个任务。数据特征包括:动作(6个关节位置)、观测状态(6个关节位置)、顶部和手腕视角的图像(480x640分辨率,30fps)、时间戳、帧索引等。数据以parquet和mp4格式存储,总数据量约300MB(数据100MB,视频200MB)。
This dataset was created by LeRobot and belongs to the robotics domain. It contains 10 episodes, 5582 frames, and 1 task. The features include: actions (6 joint positions), observation states (6 joint positions), top and wrist view images (480x640 resolution, 30fps), timestamps, frame indices, etc. The data is stored in parquet and mp4 formats, with a total size of approximately 300MB (100MB for data and 200MB for videos).
提供机构:
zeuzei
搜集汇总
数据集介绍

构建方式
在机器人学习领域,p13数据集是基于LeRobot框架构建的,旨在为仿人机器人提供标准化的运动控制数据。数据集通过遥操作方式,利用so_follower型机器人采集了10个完整的演示片段,共计5582帧,覆盖单一任务场景。数据存储采用分块化的Parquet格式,视频则以AV1编码的MP4文件保存,分别独立组织于data与videos目录下,便于大规模数据的高效加载与管理。
特点
p13数据集的核心特色在于其多模态与高帧率的融合设计。数据包含6维关节角度动作与状态信息,以及来自顶部与腕部双视角的640×480像素视频流,帧率稳定在30FPS。所有样本严格按时间戳、帧索引与片段索引对齐,确保时空一致性。此外,数据集总量约300MB,其中视频部分占200MB,既保证了数据质量,又兼顾了存储与处理的实用性。
使用方法
使用p13数据集时,推荐基于LeRobot库进行加载与预处理。用户可通过实例化LeRobotDataset类直接读取分块Parquet与视频文件,获取对齐后的动作、状态与图像序列。由于数据已按8:2比例预分为训练集与测试集,适用于监督学习中的行为克隆等范式。研究者亦可利用其标准化特征名称,便捷地接入常见的机器人学习模型,如扩散策略或Transformer-based架构。
背景与挑战
背景概述
在机器人学习领域,模仿学习依赖于高质量、多模态的演示数据集来训练策略网络,但公开可用的细粒度操作数据集仍然稀缺。p13数据集由Hugging Face的LeRobot框架创建,旨在提供一种结构化的机器人操作数据,专注于单任务、多视角的视觉-动作序列采集。该数据集录制于2024年左右,针对so_follower型机器人,记录了10个示范片段,包含5582帧、30帧每秒的同步视频(顶部与腕部摄像头)及6自由度关节动作信息。尽管规模有限,p13为研究基于视觉的机器人技能迁移、跨具身策略泛化提供了标准化测试基准,其Apache-2.0许可进一步降低了学术与工业界的复用门槛。
当前挑战
数据集当前面临的核心挑战包括:一是领域问题层面,单任务(如抓取或装配)的10个演示片段远不足以覆盖现实操作中的状态分布偏移与扰动,导致模仿学习策略在未见场景中易陷入失败。二是构建过程中,100MB的数据文件与200MB的AV1编码视频虽压缩效率高,但解码实时性成为训练瓶颈;此外,仅依赖单一位置的顶部和腕部摄像头,缺乏深度图或力觉传感,难以应对精密装配中的触觉反馈需求。数据集的10个片段未划分验证集,且无公开论文提及消融实验配置,限制了其在泛化性研究中的可复现性。
常用场景
经典使用场景
在机器人学习领域,p13数据集凭借其精细的遥操作记录特性,成为模仿学习与行为克隆任务的经典基准。该数据集包含来自so_follower机器人的10个完整episodes,共计5582帧高保真时序数据,涵盖六自由度关节动作与双视角视觉观测(顶部与腕部摄像头)。研究者常利用此数据集训练端到端策略网络,将视觉输入直接映射为连续关节控制指令,从而复现演示中的复杂操作技能,如抓取与精细操控。
实际应用
在实际部署中,p13数据集为服务型与工业机器人自动化注入动力。通过在此数据上预训练的行为克隆模型,机器人可快速适应柔性装配、物品分拣等动态任务,减少对昂贵人工编程的依赖。其双视角视频流特别适用于存在遮挡或光照变化的工厂环境,结合LeRobot框架提供的标准化工具链,研究者能无缝将仿真策略迁移至真实硬件,加速从实验室到生产线的技术转化。
衍生相关工作
围绕p13数据集,学界衍生出一系列标志性工作。基于其结构化格式,研究者开发了数据增强技术如时间重缩放和视点合成,以缓解演示不足的问题。此外,该数据集催生了探索联合动作空间表示与多任务元学习的框架,例如通过跨episode对比学习提取通用运动基元。这些工作不仅验证了自监督预训练在机器人领域的可行性,还启发了基于扩散模型的机器人轨迹生成方法,进一步拓展了数据驱动控制的理论边界。
以上内容由遇见数据集搜集并总结生成



