gym_hil_arrange_boxes_test

Hugging Face2026-03-26 更新2026-03-27 收录

下载链接：

https://huggingface.co/datasets/ansocho/gym_hil_arrange_boxes_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，专为机器人技术领域设计，采用Apache-2.0许可证。数据集包含15个总片段，1004帧，涉及1个任务，数据文件大小为100MB，视频文件大小为200MB。数据以parquet格式存储，视频以mp4格式存储，帧率为10fps。数据集结构详细描述了多个特征，包括动作（delta_x, delta_y, delta_z, gripper）、下一状态奖励、完成标志、离散惩罚、观察图像（正面和腕部）、状态观察、时间戳、帧索引、片段索引、索引和任务索引。这些特征支持机器人技术中的动作控制、状态观察和奖励反馈等任务。

创建时间：

2026-03-25

原始信息汇总

数据集概述

基本信息

数据集名称: gym_hil_arrange_boxes_test
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模

总情节数: 15
总帧数: 1004
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 10 FPS
数据拆分: 训练集 (0:15)

数据结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

名称: action
数据类型: float32
形状: [4]
维度名称: ["delta_x", "delta_y", "delta_z", "gripper"]

下一状态

名称: next.reward
数据类型: float32
形状: [1]
维度名称: null
名称: next.done
数据类型: bool
形状: [1]
维度名称: null

补充信息

名称: complementary_info.discrete_penalty
数据类型: float32
形状: [1]
维度名称: ["discrete_penalty"]

观测图像

名称: observation.images.front
数据类型: video
形状: [3, 128, 128]
维度名称: ["channels", "height", "width"]
视频信息:
- 高度: 128
- 宽度: 128
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 10
- 通道数: 3
- 包含音频: false
名称: observation.images.wrist
数据类型: video
形状: [3, 128, 128]
维度名称: ["channels", "height", "width"]
视频信息:
- 高度: 128
- 宽度: 128
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 10
- 通道数: 3
- 包含音频: false

观测状态

名称: observation.state
数据类型: float32
形状: [18]
维度名称: null

索引与时间戳

名称: timestamp
数据类型: float32
形状: [1]
维度名称: null
名称: frame_index
数据类型: int64
形状: [1]
维度名称: null
名称: episode_index
数据类型: int64
形状: [1]
维度名称: null
名称: index
数据类型: int64
形状: [1]
维度名称: null
名称: task_index
数据类型: int64
形状: [1]
维度名称: null

引用信息

主页: 未提供
论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作任务的数据采集领域，gym_hil_arrange_boxes_test数据集依托LeRobot平台构建而成。该平台通过仿真环境或真实机器人系统，记录机械臂执行整理箱子任务时的交互数据。数据以分块形式存储于Parquet文件中，共包含15个完整任务片段，总计1004帧观测记录，帧率为每秒10帧，确保了时序连续性。采集过程同步捕获了多模态信息，包括前视与腕部摄像头的视频流、机器人状态向量以及对应的动作指令与奖励信号，形成了结构化的离线强化学习数据集。

特点

该数据集在机器人视觉与状态融合表征方面具有显著特点。其观测部分融合了双视角RGB视频流，分辨率统一为128x128，编码为AV1格式以平衡质量与存储效率，同时提供了18维的连续状态向量作为补充。动作空间定义为4维浮点数组，涵盖末端执行器在三维空间中的位移及夹爪开合控制。此外，数据集嵌入了稀疏奖励信号与完成标志，并包含离散惩罚等辅助信息，支持基于图像的策略学习与状态-动作关联分析。数据以分块索引方式组织，便于流式加载与大规模分布式处理。

使用方法

针对机器人模仿学习与离线强化学习的研究需求，该数据集可通过HuggingFace数据集库直接加载。使用者需依据meta/info.json中的路径规范，按分块索引读取Parquet文件，并利用内置特征描述解析多模态字段。视频数据可通过指定键值访问，与对应的动作、状态及奖励时序对齐。数据集默认将所有15个片段划分为训练集，适用于行为克隆、价值函数拟合或世界模型训练等任务。研究人员可结合LeRobot工具链进行数据预处理、策略训练与仿真验证，以推进实体机器人操作技能的算法开发。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习已成为推动智能体掌握复杂操作技能的关键范式。gym_hil_arrange_boxes_test数据集依托HuggingFace的LeRobot项目构建，专注于机器人排列箱子的测试任务。该数据集通过记录机械臂在模拟环境中的交互数据，包括多视角视觉观测、状态信息及动作指令，旨在为机器人操作策略的评估与泛化研究提供基准资源。尽管具体创建时间与核心研究团队信息尚未公开，但其结构设计体现了当前机器人学习对高质量、多模态演示数据的迫切需求，对促进机器人灵巧操作算法的实证比较具有潜在影响力。

当前挑战

该数据集致力于解决机器人操作中的箱子排列任务，其核心挑战在于如何使智能体在动态环境中实现精确的抓取、放置与堆叠操作，这要求算法具备高度的空间感知与序列决策能力。构建过程中的挑战则体现在数据采集的复杂性与一致性上：需同步记录来自前视与腕部摄像头的高帧率视频流，并确保动作指令与状态观测的精准对齐；同时，在有限任务实例下生成足够多样化的交互轨迹以支持策略泛化，亦对仿真环境的设计与数据标注流程提出了较高要求。

常用场景

经典使用场景

在机器人学习领域，gym_hil_arrange_boxes_test数据集为模拟环境中的机械臂操作任务提供了关键支持。该数据集通过记录机械臂在整理箱子任务中的动作序列、状态观测及奖励信号，典型地应用于离线强化学习算法的训练与验证。研究者可利用其包含的前置与腕部摄像头视频流，结合多维状态向量，构建端到端的策略模型，以优化机械臂在复杂抓取与放置场景中的自主决策能力。

衍生相关工作

围绕该数据集，学术界衍生出多项经典研究，例如基于视觉Transformer的机械臂动作预测模型，以及结合逆强化学习的技能模仿框架。这些工作利用数据集的时序动作与状态轨迹，开发了高效的多任务策略迁移方法，进一步拓展了机器人操作在开放世界中的泛化能力，为后续的模块化技能组合与元学习探索奠定了数据基石。

数据集最近研究