eval_act_newgripper_100k_01

Hugging Face2026-05-11 更新2026-05-15 收录

下载链接：

https://huggingface.co/datasets/AlexanderRoempke/eval_act_newgripper_100k_01

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot平台创建，是一个用于机器人技术研究的开源数据集，采用Apache-2.0许可证。数据集包含机器人操作任务的演示数据，具体针对ned2型机器人。数据集规模为2个完整任务片段（episodes），总计1006个时间帧，数据以分块Parquet文件（每块约1000帧）和MP4视频文件形式存储，总数据量约300MB（数据文件100MB，视频文件200MB）。数据采集帧率为21fps。数据集包含以下核心特征字段：1. **动作（action）**：7维浮点向量，表示机器人关节位置控制指令，包括基座到手臂、手臂到肘部、肘部到前臂、前臂到手部、手部到肩部、肩部到腕部以及夹爪的位置。2. **状态观测（observation.state）**：7维浮点向量，与动作字段结构一致，表示机器人各关节的实际位置状态。3. **图像观测（observation.images）**：包含两个相机视角（camera1和camera2）的RGB视频流，每帧图像分辨率为640x480，3通道，采用AV1编码，无音频。4. **元数据字段**：包括时间戳（timestamp）、帧索引（frame_index）、片段索引（episode_index）、全局索引（index）和任务索引（task_index）。数据集适用于机器人模仿学习、强化学习、行为克隆等任务，特别是基于视觉和状态信息的机器人操作策略学习。数据已划分为训练集（包含全部2个片段）。

创建时间：

2026-05-09

搜集汇总

数据集介绍

构建方式

该数据集基于LeRobot框架构建，旨在为机器人操控任务提供标准化的训练与评估资源。数据集采集自Ned2型机械臂，记录了单一操控任务的完整执行过程，包含2个独立episode，共计109帧时序数据，采样频率为每秒21帧。数据以parquet格式存储结构化信息，并采用分块机制（chunks_size=1000）管理大规模文件，同时将视觉观测以AV1编码的MP4视频文件独立保存，确保数据加载效率与存储平衡。

特点

数据集融合多模态信息，涵盖7维关节位置动作序列（action）与对应观测状态（observation.state），并配备两个视角的视觉图像（camera1与camera2），每个视角均提供640x480分辨率、3通道彩色视频流。其特色在于将机械臂末端夹爪（gripper）的运动信息明确纳入动作与状态空间，为抓取等精细操作研究提供关键支持。全部数据以Apache-2.0许可发布，便于学术与工业界复用。

使用方法

通过HuggingFace Datasets库可直接加载数据集，指定config_name为'default'，数据文件位于'data/*/*.parquet'路径。用户可按episode_index与frame_index索引时序片段，也可利用LeRobot提供的训练框架直接调用。训练阶段建议采用train split（覆盖episode 0至1），将action作为监督信号，结合observation.state与视觉图像预测机械臂控制指令。视频数据需解码后使用，注意camera1与camera2的同步对齐。

背景与挑战

背景概述

该数据集名为eval_act_newgripper_100k_01，创建于机器人学习与模仿学习领域快速发展的背景下，由HuggingFace LeRobot社区主导构建，旨在为机械臂精细操作任务提供标准化的训练与评估数据。核心研究问题聚焦于利用视觉观测与动作状态序列，驱动基于ACT（Action Chunking Transformers）等算法的机器人操控策略学习。数据集包含2个示范回合、共109帧时间步，记录了NED2型机械臂7自由度关节位置及夹爪状态，并配备双视角高清视频流。尽管规模有限，但该数据集体现了从仿真或真实环境采集、通过parquet与视频文件复合存储的现代机器人数据集范式，为验证小样本模仿学习算法提供了基础平台。

当前挑战

该数据集所应对的领域挑战在于解决机器人精细抓取与装配任务中的演示数据匮乏与动作泛化难题，尤其在新型夹爪（newgripper）配置下，传统基于模型的操控方法难以适应非结构化环境。构建过程中面临的主要挑战包括：视频与动作数据的高频同步采集（21 FPS），需保证时间戳对齐精度；仅2个示范回合的极小样本量要求算法具备从有限数据中提取有效动作表征的能力；100MB的parquet数据与200MB的视频文件体积，对存储与快速加载提出效率要求。此外，7维连续动作空间的高自由度特性，加剧了策略学习时对动作分布建模的复杂性。

常用场景

经典使用场景

在机器人学习与操控领域，eval_act_newgripper_100k_01数据集为模仿学习算法提供了宝贵的训练与评估平台。该数据集通过记录Ned2机械臂在抓取任务中的7维关节空间动作及状态序列，辅以双视角摄像头捕捉的视觉观测，构建了端到端的感知-动作闭环。研究者常使用该数据集训练行为克隆或基于Transformer的动作生成模型，旨在让机器人在未见场景中复现演示轨迹，是评估算法对高精度抓取操作泛化能力的经典基准。

衍生相关工作

该数据集的发布衍生了多个经典工作，如基于扩散策略的机器人动作生成模型，利用其多模态数据学习去噪过程以提升抓取鲁棒性。另有研究将其与领域随机化结合，通过数据增强构建合成训练集，验证了跨场景泛化能力。此外，基于该数据集的评估范式促使ACT（Action Chunking with Transformers）等算法提出，这些工作聚焦于时序动作块编码，有效解决了长视距任务中的累积误差问题，推动了端到端机器人学习的前沿发展。

数据集最近研究