so101_gamepad_eval

Hugging Face2026-02-27 更新2026-02-28 收录

下载链接：

https://huggingface.co/datasets/SonDePoisson/so101_gamepad_eval

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，主要用于机器人技术领域。数据集采用apache-2.0许可证。数据集的结构包括5个总剧集，4042个总帧数，1个总任务，数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集的特征包括动作（ee.x, ee.y, ee.z, ee.wx, ee.wy, ee.wz, ee.gripper_pos）、观察状态（与动作相同）、观察图像（顶部和手腕，均为480x640x3的视频）、时间戳、帧索引、剧集索引、索引和任务索引。数据以parquet格式存储，视频以mp4格式存储。

创建时间：

2026-02-27

原始信息汇总

so101_gamepad_eval 数据集概述

基本信息

许可证：Apache-2.0
任务类别：机器人学
标签：LeRobot
创建工具：使用 LeRobot 创建。

数据集规模与结构

总情节数：5
总帧数：4032
总任务数：1
分块大小：1000
数据文件大小：100 MB
视频文件大小：200 MB
帧率：30 FPS
数据拆分：训练集（索引 0 至 5）
数据文件路径模式：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

数据集包含以下特征字段：

动作

数据类型：float32
形状：[7]
字段名：ee.x, ee.y, ee.z, ee.wx, ee.wy, ee.wz, ee.gripper_pos

观测状态

数据类型：float32
形状：[7]
字段名：ee.x, ee.y, ee.z, ee.wx, ee.wy, ee.wz, ee.gripper_pos

观测图像（顶部摄像头）

数据类型：video
形状：[480, 640, 3]
字段名：height, width, channels
视频信息：
- 高度：480 像素
- 宽度：640 像素
- 编码格式：av1
- 像素格式：yuv420p
- 非深度图
- 帧率：30 FPS
- 通道数：3
- 无音频

观测图像（腕部摄像头）

数据类型：video
形状：[480, 640, 3]
字段名：height, width, channels
视频信息：
- 高度：480 像素
- 宽度：640 像素
- 编码格式：av1
- 像素格式：yuv420p
- 非深度图
- 帧率：30 FPS
- 通道数：3
- 无音频

元数据

时间戳：数据类型 float32，形状 [1]
帧索引：数据类型 int64，形状 [1]
情节索引：数据类型 int64，形状 [1]
索引：数据类型 int64，形状 [1]
任务索引：数据类型 int64，形状 [1]

附加信息

主页：[More Information Needed]
论文：[More Information Needed]
引用格式：[More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。so101_gamepad_eval数据集依托LeRobot开源框架构建，通过人工操作游戏手柄远程操控机器人，系统采集了机器人执行任务过程中的多模态交互数据。数据以分块形式组织，包含5个完整任务片段，总计4032帧，并以Parquet格式高效存储，确保了数据的结构化与可扩展性。

使用方法

研究人员可利用该数据集进行机器人模仿学习或离线强化学习模型的训练与验证。数据加载可通过标准Parquet读取流程实现，并依据帧索引与片段索引进行时序重组。双路视频流可与状态数据对齐，用于构建端到端的感知-控制映射模型。鉴于其评估集的定位，该数据尤适于在已知任务上测试策略的泛化能力与鲁棒性，为算法比较提供基准。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的发展亟需高质量、结构化的真实世界交互数据集。so101_gamepad_eval数据集应运而生，它由LeRobot项目团队构建，旨在为机器人操控任务提供评估基准。该数据集聚焦于机器人末端执行器的轨迹控制与视觉感知，通过记录操作员使用游戏手柄操控机器人执行任务的过程，捕捉了多模态的观测数据与对应的动作指令。其核心研究问题在于如何利用人类演示数据来训练机器人策略，以实现在复杂环境中的灵巧操作，对推动机器人自主技能学习具有重要价值。

当前挑战

该数据集致力于解决机器人模仿学习中从人类演示到机器人动作映射的挑战，具体涉及高维连续动作空间的泛化与多视角视觉信息的对齐问题。在构建过程中，面临数据采集的一致性与完整性挑战，例如确保不同演示片段在任务执行上的连贯性，以及同步处理来自顶部摄像头与腕部摄像头的视频流。此外，数据标注与结构化存储也需克服技术障碍，以将原始传感器数据转化为适用于机器学习训练的标准化格式，同时保持时间序列的精确同步与元数据的有效组织。

常用场景

经典使用场景

在机器人学习领域，so101_gamepad_eval数据集为模仿学习与强化学习算法的评估提供了关键基准。该数据集通过记录SO Follower机器人的末端执行器状态、夹爪位置及多视角视觉观测，构建了真实环境下的交互轨迹。研究者能够利用这些多模态数据，训练模型从视觉输入中推断动作策略，从而在仿真或实际机器人平台上验证算法的泛化能力与鲁棒性。

解决学术问题

该数据集有效应对了机器人学中样本效率低下与仿真到现实迁移的挑战。通过提供高质量的真实世界交互数据，它支持端到端策略学习的研究，减少了在物理平台上收集数据的成本与风险。其结构化的动作-观测对有助于探索视觉-运动协调、时序决策等核心问题，推动了数据驱动机器人控制方法的理论进展。

实际应用

在实际机器人部署中，so101_gamepad_eval数据集可用于服务机器人或工业自动化场景的任务编程。例如，基于数据集的预训练模型能够引导机器人执行抓取、放置等精细操作，提升在非结构化环境中的适应性。此外，数据集支持快速原型开发，为机器人系统在物流、装配等领域的应用提供了可靠的数据基础。

数据集最近研究