il_gym

Hugging Face2025-11-14 更新2025-11-15 收录

下载链接：

https://huggingface.co/datasets/PinkOcelot/il_gym

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学数据集，由LeRobot创建。它包含了12个剧集，共计9217帧，专注于一个任务。数据集以.parquet文件格式存储，并提供了对应的视频文件。数据集的特征包括机器人的动作、状态、正面和手腕的图像信息等。数据集的帧率为30fps，并且按照训练集进行划分。

创建时间：

2025-11-10

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

规模统计

总情节数: 12
总帧数: 9217
总任务数: 1
数据分块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
数据分割: 训练集 (0:12)

数据特征

动作特征

数据类型: float32
维度: [9]
特征名称:
- arm_shoulder_pan.pos
- arm_shoulder_lift.pos
- arm_elbow_flex.pos
- arm_wrist_flex.pos
- arm_wrist_roll.pos
- arm_gripper.pos
- x.vel
- y.vel
- theta.vel

观测状态

数据类型: float32
维度: [9]
特征名称: 与动作特征相同

图像观测

前视摄像头:

数据类型: 视频
分辨率: 480×640×3
视频编码: av1
像素格式: yuv420p
深度图: 否
音频: 无

腕部摄像头:

数据类型: 视频
分辨率: 640×480×3
视频编码: av1
像素格式: yuv420p
深度图: 否
音频: 无

索引特征

时间戳: float32 [1]
帧索引: int64 [1]
情节索引: int64 [1]
索引: int64 [1]
任务索引: int64 [1]

文件结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

主页: 待补充
论文: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人学习领域，il_gym数据集通过LeRobot框架系统性地采集了真实环境中的交互数据。该数据集包含12个完整任务片段，总计9217帧观测记录，以30帧/秒的速率捕捉机械臂运动轨迹。数据以分块形式存储于Parquet文件中，每块容量为1000帧，同时配套存储500MB的视频资料，完整记录了前视与腕部视角的视觉信息。

特点

该数据集最显著的特点是融合了多模态观测信息，既包含9维关节位置与速度的精确数值记录，又整合了双视角视觉数据。前视摄像头以480×640分辨率捕捉环境全景，腕部摄像头则以640×480特写机械臂操作细节。所有视频均采用AV1编码压缩，在保持视觉保真度的同时优化存储效率。数据维度涵盖时空索引、任务标识等元数据，为模仿学习研究提供结构化支持。

使用方法

研究者可通过解析Parquet数据文件直接获取数值化观测与动作序列，配合MP4视频文件实现行为复现与分析。数据集采用标准化的特征命名规范，动作空间包含肩部平移、肘部屈伸等6个关节控制量及3维末端速度指令。训练时可按分块索引加载数据，利用时间戳与帧索引重建完整任务轨迹，适用于行为克隆、强化学习等算法验证。

背景与挑战

背景概述

在机器人学习领域，il_gym数据集作为LeRobot框架的产物，聚焦于强化学习与模仿学习的交叉研究。该数据集通过记录机械臂的多模态交互数据，包括关节位置、速度控制及视觉感知信息，旨在解决复杂环境下机器人动作策略的泛化问题。其构建体现了HuggingFace社区对开源机器人数据的标准化探索，通过结构化存储9217帧操作序列，为模仿学习算法提供了高维状态-动作对的基准测试平台。

当前挑战

该数据集核心挑战在于解决高自由度机械臂的精细操作任务，需从多视角视频流与连续控制信号中提取可泛化的动作表征。构建过程中面临多传感器时序对齐的复杂性，包括前视与腕部相机数据的空间校准，以及9维动作空间与状态观测的同步记录。此外，小规模样本（仅12条轨迹）对模型泛化能力提出严峻考验，需克服数据稀疏性带来的过拟合风险。

常用场景

经典使用场景

在机器人学习领域，il_gym数据集通过记录机械臂执行任务时的多模态数据，为模仿学习算法提供了丰富的训练素材。该数据集包含12个完整任务片段，涵盖关节位置、速度控制以及双视角视觉信息，特别适用于研究从演示中学习策略的算法验证。研究者可利用其结构化的动作序列和观测数据，开发能够理解复杂操作任务的智能体。

实际应用

在实际工业场景中，il_gym数据集支撑了自动化装配与精密操作系统的开发。基于该数据集训练的模型可应用于物料分拣、零件组装等流水线作业，通过模仿人类操作员的动作模式，实现机械臂的精准控制。其包含的腕部与正面双视角视觉数据，为复杂环境下的物体抓取与姿态调整提供了重要参考。

衍生相关工作

围绕il_gym数据集已衍生出多项重要研究，特别是在端到端模仿学习框架的构建方面。基于该数据集的基准测试推动了时空特征提取网络的发展，许多工作专注于融合视觉信息与运动规划的方法创新。这些研究不仅完善了多模态数据处理流程，还为机器人技能迁移学习奠定了理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集