so101_pegbox_v1

Hugging Face2025-08-09 更新2025-08-10 收录

下载链接：

https://huggingface.co/datasets/InAbsentia/so101_pegbox_v1

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人技术的数据集，包含了10个剧集，9683帧图像，共1个任务，30个视频文件，数据以Parquet格式存储。数据集提供了包括动作、观测状态、工作区图像、手腕图像等丰富的特征信息，适用于机器人相关的研究和开发。

创建时间：

2025-08-09

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so101_pegbox_v1数据集通过LeRobot框架系统性地采集了双手机器人的操作数据。该数据集包含10个完整操作片段，总计9683帧，以30fps的帧率记录了机械臂关节位置、夹爪状态及多视角视觉信息。数据以分块Parquet格式存储，确保了高效存取与处理，每个数据块容纳1000帧，涵盖了左右肩、肘、腕等12维动作与状态空间。

特点

该数据集的核心特征在于其多模态观测体系，不仅提供12维关节角度与夹爪状态的精确数值记录，还同步采集了工作区、左右腕部三路高清视频流。工作区图像分辨率为480×640，腕部视角为240×320，均以AV1编码存储，兼顾视觉细节与存储效率。时间戳、帧索引与任务标识符的完整标注，为时序分析与任务推理提供了结构化支撑。

使用方法

研究者可通过加载Parquet数据文件直接访问动作-观测对，其中动作向量包含左右机械臂各6自由度控制指令，观测层则融合状态数据与三路视频流。数据集默认划分为训练集（全部10个片段），适用于模仿学习、行为克隆等算法训练。视频数据可通过指定路径解码，结合帧索引实现动作-视觉的跨模态对齐分析。

背景与挑战

背景概述

机器人操作数据集so101_pegbox_v1由HuggingFace的LeRobot项目创建，专注于双臂协同操作任务研究。该数据集通过集成双腕视觉传感器与12维关节控制信号，构建了包含9683帧操作序列的多模态数据资源。其设计初衷在于解决复杂环境下机器人精细操作策略的泛化问题，为模仿学习与强化学习算法提供高质量的训练基准。

当前挑战

该数据集需解决双臂协同操作中的高维动作空间建模与多视角视觉感知融合难题。构建过程中面临多传感器时序同步精度控制、大规模操作视频数据压缩存储等技术挑战，同时需确保10个完整操作任务序列在30fps采样率下的时空一致性。

常用场景

经典使用场景

在机器人学习领域，so101_pegbox_v1数据集为双臂协同操作任务提供了标准化的实验基准。该数据集通过记录双手机械臂执行插孔装配任务的完整运动轨迹和视觉信息，成为模仿学习与强化学习算法的经典训练素材。研究者可利用其多模态观测数据（包括关节状态、夹爪位姿及三视角视频流）来开发精细的动作生成模型，特别适用于需要高精度空间协调的工业操作场景。

实际应用

在实际工业自动化场景中，该数据集可直接应用于精密装配线的机器人编程优化。基于数据集训练的模型能够指导双手机械臂完成电子元件插接、精密仪器组装等高精度任务，大幅降低传统示教编程的时间成本。在柔性制造系统中，此类数据驱动的操作方法能快速适应新产品线的工艺要求，提升生产线的重构效率与操作精度。

衍生相关工作

基于该数据集衍生的经典研究包括多智能体协同控制算法开发与跨模态迁移学习框架构建。众多研究者利用其丰富的时空特征，提出了基于注意力机制的动作分割模型和视觉-运动联合嵌入方法。这些工作显著提升了机器人操作策略的泛化性能，并催生了新一代模仿学习框架在复杂操作任务中的应用，为机器人技能学习领域奠定了重要理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集