lilkm/so100_gamepad_usb_insert

Name: lilkm/so100_gamepad_usb_insert
Creator: lilkm
Published: 2026-04-30 13:16:05
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/lilkm/so100_gamepad_usb_insert

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，包含5个episodes，703个frames和1个task。数据集的结构包括多种特征，如action（包含delta_x、delta_y、delta_z和gripper）、next.reward、next.done、observation.images.top和observation.images.wrist等。数据文件格式为parquet和mp4，license为apache-2.0。

This dataset was created by LeRobot and consists of 5 episodes, 703 frames, and 1 task. The dataset structure includes various features such as action (including delta_x, delta_y, delta_z, and gripper), next.reward, next.done, observation.images.top, and observation.images.wrist. The data files are in parquet and mp4 formats, and the license is apache-2.0.

提供机构：

lilkm

搜集汇总

数据集介绍

构建方式

so100_gamepad_usb_insert数据集依托LeRobot框架进行构建，专注于机器人操作领域中的USB插入任务。该数据集通过遥操作方式采集，利用游戏手柄控制SO100机械臂执行精准的USB接口插入动作。数据采集过程中，同步记录来自顶部与腕部双视角的高清视频流，以及机械臂关节状态、末端执行器位姿等18维状态信息。全部原始数据被标准化为Parquet格式存储，视频则采用AV1编码压缩为128×128分辨率的MP4文件，总计包含5个完整操作回合、703帧有效画面，数据与视频文件容量分别约为100MB和200MB。

特点

数据集最显著的特点在于其多模态融合的设计理念，同时包含视觉观测、运动状态与操作动作三类核心信息。视觉模态提供top和wrist双通道RGB视频，分别从全局视角和腕部近端视角捕捉操作细节；状态模态记录机械臂完整的伺服数据；动作模态则定义四维连续控制信号，涵盖三维空间位移与夹爪开合。所有数据以10帧/秒的稳定频率采样，确保时间对齐精度。此外，数据集内嵌episode_index、frame_index等结构化索引，便于切片检索与轨迹重放，同时保留了奖励信号与终止条件等强化学习所需的关键标注。

使用方法

该数据集主要通过LeRobot库进行加载与处理，用户可直接通过HuggingFace的datasets接口访问。典型使用流程包括：首先使用LeRobot的帧数据集API读取Parquet文件中的时序序列，将多模态观测与动作数据同步对齐；随后可依据episode_index将各回合拆分为独立轨迹，配合配套的MP4视频文件进行可视化验证。数据集中包含了train单一划分方式，5个回合全部用于训练。对于模仿学习场景，研究者可直接采样动作序列作为监督信号；对于强化学习任务，则可利用next.reward与next.done字段构建马尔可夫决策过程。建议搭配视觉预处理器将128×128图像缩放至模型输入尺寸，并可灵活选择仅使用单一视角或融合双通道视觉特征。

背景与挑战

背景概述

在机器人操作领域，精细的插拔任务（如USB接口对接）长期被视为验证灵巧操作与感知控制能力的核心基准。so100_gamepad_usb_insert数据集由LeRobot社区于近期创建，依托HuggingFace平台发布，旨在通过记录游戏手柄式机械臂执行USB插入操作的多模态数据，推动机器人从示范中学习（Learning from Demonstration）方法的发展。该数据集包含5个完整操作回合、703帧时序数据，以10帧每秒的频率采集了顶部与腕部两个视角的128×128像素图像、18维状态信息以及4维动作指令（包括位置增量与夹爪控制），为研究精细插拔任务中的视觉-运动耦合提供了标准化资源。尽管规模有限，但该数据集聚焦于高精度接触任务，为评估模仿学习算法在真实场景下的泛化能力与鲁棒性提供了关键基准。

当前挑战

该数据集所解决的领域核心挑战在于如何使机器人掌握USB插入这类需要精确力控与对齐操作的任务，传统编程方法难以应对非结构化环境中的微小误差与接触动力学变化。构建过程中面临的主要挑战包括：其一，数据采集依赖人工遥操作，轨迹一致性与质量受操作员熟练度影响，5个回合的样本量限制了算法对任务变异性（如不同插入角度、力度）的建模能力；其二，高维观测空间（双摄像头图像与状态向量）与低维离散动作之间的映射复杂，且10Hz的采样频率可能无法捕捉快速接触事件中的瞬态动力学特征；其三，现有特征仅包含位置增量与二值夹爪信号，缺乏末端力反馈数据，导致模型在力控策略学习上存在先天局限，难以应对插拔硬配合时的微小形变与摩擦变化。

常用场景

经典使用场景

在机器人学习与操控领域，so100_gamepad_usb_insert数据集专为精细操作任务而设计，其核心场景聚焦于机器人通过视觉引导完成USB接口的精准插入。该数据集利用LeRobot框架采集，包含5个演示片段、703帧高质量视频数据，涉及顶置与腕部双视角摄像头捕捉的128×128像素图像，以及18维状态空间与4维动作空间（包括三维平移与夹爪控制）。这一配置使其成为模仿学习与强化学习算法训练的理想平台，尤其适用于样本效率提升与策略泛化能力的研究。

衍生相关工作

该数据集衍生了一系列经典工作，最凸显的是在机器人模仿学习框架下的基础研究。例如，LeRobot社区基于其特性开发了数据集可视化与重放工具，便于研究者直观分析演示质量。同时，它启发了高精度微操作领域的联合工作，如结合Transformer架构的序列建模方法，用于学习长时域操作策略。此外，多视角融合与隐式表示的研究也从中汲取灵感，推动了数据高效学习技术在机器人实验中的落地，形成了从数据采集到模型验证的闭环生态。

数据集最近研究