lilkm/so100_gamepad_insert

Name: lilkm/so100_gamepad_insert
Creator: lilkm
Published: 2026-05-01 14:02:36
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/lilkm/so100_gamepad_insert

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。包含30个episodes，3481帧，1个任务，数据文件大小为100MB，视频文件大小为200MB。数据集中包含动作（delta_x, delta_y, delta_z, gripper）、奖励、完成状态、观测状态（包括顶部和手腕的摄像头视频数据，分辨率为128x128，10fps）等多种特征。视频数据采用av1编解码器，yuv420p像素格式。

This dataset was created using LeRobot and is primarily used in the field of robotics. It contains 30 episodes, 3481 frames, and 1 task, with data files sized at 100MB and video files at 200MB. The dataset includes various features such as actions (delta_x, delta_y, delta_z, gripper), rewards, done states, and observation states (including top and wrist camera video data with a resolution of 128x128 at 10fps). The video data uses the av1 codec and yuv420p pixel format.

提供机构：

lilkm

搜集汇总

数据集介绍

构建方式

在机器人操作学习领域，高质量的行为数据是驱动策略模型从模仿迈向智能的关键。so100_gamepad_insert数据集基于LeRobot框架精心构建，旨在捕捉机器人利用游戏手柄进行插入操作的精细运动轨迹。该数据集通过遥操作方式采集，共收录30个完整回合、总计3481帧的动作序列，涵盖了单一的精细操作任务。所有数据被组织为以1000帧为单位的块结构，并以高效的Parquet格式存储，同时采用AV1编解码压缩的128x128分辨率视频记录双视角视觉信息，从而在数据完整性与存储效率间取得平衡。

使用方法

对于希望利用该数据集进行模仿学习或机器人技能迁移的研究者，可借助LeRobot生态快速开展工作。数据集已在HuggingFace平台提供可视化交互界面，使用者无需下载即可直接预览样本。在训练阶段，推荐将Parquet数据与视频文件结合加载，利用LeRobot内置的DataLoader按回合索引抽取状态与动作序列，作为端到端策略网络的输入。针对插入任务特有的连续性，建议对动作序列进行滑动窗口采样，以增强模型对时序依赖的捕获能力。同时，由于数据集已预分训练集（前30个回合），研究者可直接将全部数据用于监督学习，或将奖励信号融入强化学习框架进行离线策略评估。

背景与挑战

背景概述

在机器人学习领域，数据驱动的模仿学习正逐步成为解决复杂操作任务的核心范式。so100_gamepad_insert数据集由Hugging Face社区研究者基于LeRobot框架构建，创建于当前深度学习与具身智能交融的时期，旨在为机器人精细操作提供标准化训练资源。该数据集聚焦于“游戏手柄插入”这一典型精细操作任务，共包含30个演示片段、3481帧数据，通过顶置与腕部双视角高清视频（128×128像素）记录操作过程，并同步采集18维状态信息及四维动作指令（包括三维空间平移与夹爪控制），为研究机器人从视觉观察到运动控制的端到端映射提供了高质量标注样本。其开源Apache-2.0许可协议与规范的元数据结构，显著降低了学术机构在机器人操作领域开展复现研究与算法对比的门槛，推动了具身智能中少样本学习与迁移学习技术的发展。

当前挑战

该数据集所应对的领域核心挑战在于解决高精度、强约束条件下的机器人精细操控问题，具体包括：游戏手柄插入任务要求机械臂在毫米级精度内完成对准与插拔动作，传统几何规划方法难以应对视觉反馈延迟与接触力突变带来的不确定性。数据构建过程中面临的挑战尤为突出，因任务涉及小批量多品种的演示采集，30个演示片段虽能覆盖基本操作模式，但难以穷尽真实场景中的多样化接触状态与随机扰动；同时，双摄像头视角同步捕获时需消除图像帧与位姿数据的时间戳偏差，而10Hz采样频率在应对快速插入动作时可能存在运动模糊与关键帧丢失风险，需通过额外的时序平滑算法进行补偿。

常用场景

经典使用场景

在机器人学习与灵巧操作领域，so100_gamepad_insert数据集为模仿学习和行为克隆提供了宝贵的训练素材。该数据集包含30个完整演示片段，共计3481帧图像与动作记录，以10帧每秒的速率捕捉了SO-100机械臂执行游戏手柄插入任务的精细操作过程。数据集通过顶部与腕部双视角摄像头获取128x128像素的视觉观测信息，同时记录了包含笛卡尔空间增量位移（delta_x、delta_y、delta_z）和夹爪开合度（gripper）在内的四维动作指令。研究者能够借助这一精心构建的资源，训练机器人从视觉输入直接映射到精准操作策略的神经网络模型。

解决学术问题

该数据集的核心学术价值在于解决了精密装配任务中高精度灵巧操作的模仿学习难题。传统强化学习方法在面对手柄插入这类需要亚毫米级别对齐与力觉反馈的任务时，往往因探索空间过大而收敛困难。so100_gamepad_insert通过提供专家演示轨迹，使得研究人员能够聚焦于构建高效的视觉-运动策略网络，探索如何从有限演示中泛化至不同初始条件。数据集填补了开源社区在高保真、多模态感知的插入式装配任务方面的资源空白，促进了机器人学习领域对于小样本模仿学习、动作序列建模以及视觉伺服控制等前沿问题的深入探索。

实际应用

在实际产业应用中，so100_gamepad_insert数据集所代表的精密装配技能学习具有广阔前景。电子制造业中的连接器插拔、玩具组装线上的零部件嵌入、以及消费电子产品的手柄按钮安装等场景均与该数据集的核心理念高度契合。通过在此类数据集上训练的策略模型，工业机器人能够从固定编程模式中解放出来，自适应地应对微小零件的位置偏差与角度变化。该数据集所代表的低成本双臂协作平台（SO-100）也预示着中小制造企业能够以较低门槛实现柔性生产线的智能化升级，从而减轻人力在生产精度要求严苛环节中的高强度重复劳动负担。

数据集最近研究