eval_act_merge-unit3-unit4_200kd

Hugging Face2026-03-27 更新2026-03-28 收录

下载链接：

https://huggingface.co/datasets/griffinnosidda/eval_act_merge-unit3-unit4_200kd

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，适用于机器人技术领域的研究和应用。数据集采用Apache-2.0许可，包含机器人动作和观察数据，特别针对双手机器人（arxl5_ros2_bimanual）设计。数据集包含2个episodes，共135帧，涉及1个任务。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集的特征包括14维的动作和状态观察数据（分别对应左右手的6个关节和1个夹爪），以及来自左腕、右腕和中心摄像头的视频观察（分辨率480x848，3通道，30fps）。此外，还包含时间戳、帧索引、episode索引等元数据。该数据集适用于机器人控制、行为克隆和强化学习等任务。

创建时间：

2026-03-25

原始信息汇总

数据集概述

基本信息

数据集名称: eval_act_merge-unit3-unit4_200kd
创建工具: 使用 LeRobot 创建。
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

整体统计

代码库版本: v3.0
机器人类型: arxl5_ros2_bimanual
总情节数: 2
总帧数: 135
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (train) 包含所有情节 (0:2)

文件路径格式

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [14]
名称: left.joint_1, left.joint_2, left.joint_3, left.joint_4, left.joint_5, left.joint_6, left.gripper, right.joint_1, right.joint_2, right.joint_3, right.joint_4, right.joint_5, right.joint_6, right.gripper

观测状态

数据类型: float32
形状: [14]
名称: 与动作特征名称相同

观测图像

左腕图像:
- 数据类型: video
- 形状: [480, 848, 3] (高度, 宽度, 通道)
- 视频信息: 高度480, 宽度848, 编解码器h264, 像素格式yuv420p, 非深度图, 帧率30 FPS, 通道数3, 无音频
右腕图像:
- 数据类型: video
- 形状: [480, 848, 3] (高度, 宽度, 通道)
- 视频信息: 与左腕图像相同
中心图像:
- 数据类型: video
- 形状: [480, 848, 3] (高度, 宽度, 通道)
- 视频信息: 与左腕图像相同

元数据

时间戳: 数据类型 float32, 形状 [1]
帧索引: 数据类型 int64, 形状 [1]
情节索引: 数据类型 int64, 形状 [1]
索引: 数据类型 int64, 形状 [1]
任务索引: 数据类型 int64, 形状 [1]

补充信息

主页: 未提供
论文: 未提供
引用信息: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集是推动算法发展的基石。eval_act_merge-unit3-unit4_200kd数据集依托LeRobot平台构建，其数据采集过程聚焦于双机械臂机器人系统。该数据集通过记录真实机器人执行任务时的状态与动作序列生成，具体涵盖了机械臂关节角度、夹爪状态以及多视角视觉观测。数据以分块形式存储于Parquet文件中，并辅以同步录制的视频流，确保了时序信息与感知数据的严格对齐，为后续的离线强化学习或模仿学习研究提供了结构化的原始素材。

特点

该数据集的核心特征在于其多维度的异构数据融合与精细的时空对齐。数据集中不仅包含14维的双臂关节动作与状态向量，还整合了来自左腕、右腕及中央视角的三路高清视频流，每路视频均以30帧每秒的速率录制，分辨率达到848x480。这种多模态设计使得研究者能够同时利用低维控制信号与高维视觉感知进行模型训练。此外，数据集通过时间戳、帧索引与回合索引等元数据，确保了动作-观测对的严格时序一致性，为序列决策模型的构建奠定了可靠基础。

使用方法

对于希望利用该数据集的研究者而言，其标准化的存储格式便于直接加载与分析。数据以分块Parquet文件组织，可通过Hugging Face数据集库或兼容工具进行读取，并利用内置的元数据文件理解数据结构。典型的使用场景包括机器人策略学习、行为克隆或视觉运动控制模型的训练与评估。研究者可依据任务索引或回合索引提取特定任务轨迹，将动作、状态观测及同步视频帧作为输入输出对，用于训练端到端的控制模型或进行离线策略分析。数据集提供的可视化工具亦支持直观地浏览与验证数据内容。

背景与挑战

背景概述

在机器人学习领域，高质量的数据集是推动算法发展的基石。eval_act_merge-unit3-unit4_200kd数据集由Hugging Face的LeRobot项目创建，专注于双机械臂机器人操作任务。该数据集整合了单元3和单元4的评估动作数据，旨在为机器人控制与模仿学习提供丰富的多模态训练资源。其核心研究问题在于如何通过真实世界的交互数据，提升机器人在复杂环境中的自主操作能力与泛化性能。尽管具体创建时间与主要研究人员信息尚未公开，但该数据集依托于先进的ARXL5双机械臂平台，采集了包括关节状态、视觉观测在内的多维信息，对推动机器人行为克隆与强化学习研究具有潜在影响力。

当前挑战

该数据集致力于解决机器人操作中的动作评估与策略优化挑战，其核心问题在于如何从高维感官输入中学习精确且鲁棒的控制策略。构建过程中面临多重困难：数据采集需协调双机械臂的同步运动与多视角视觉流，确保时序对齐与传感器校准；大规模数据存储与处理涉及视频编码与结构化特征提取，对计算资源提出较高要求；此外，真实环境下的任务多样性有限，数据规模相对较小，可能制约模型的泛化能力。这些挑战共同指向机器人学习数据集的标准化与可扩展性需求。

常用场景

经典使用场景

在机器人学领域，eval_act_merge-unit3-unit4_200kd数据集为双机械臂操作任务提供了丰富的多模态数据资源。该数据集通过记录ARXL5双机械臂系统的关节状态、夹爪动作以及多视角视觉信息，典型应用于模仿学习算法的训练与评估。研究者能够利用这些同步采集的动作指令与观测序列，构建端到端的策略模型，使机器人学习执行复杂的双手协调操作，如物体抓取与装配，从而推动机器人自主操作能力的提升。

实际应用

在实际工业与服务业场景中，该数据集能够直接支撑双机械臂系统的技能编程与自动化流程开发。基于数据驱动的策略，机器人可执行精细的装配、分拣或维修任务，适应柔性生产线的需求。视觉与关节数据的结合，使得系统能够在非结构化环境中进行实时感知与决策，提升自动化系统的适应能力与操作精度，为智能制造、物流仓储等领域的机器人部署提供可靠的技术验证基础。

衍生相关工作

围绕该数据集，已衍生出一系列专注于双机械臂模仿学习与强化学习的经典研究工作。这些工作通常利用其多模态特性，开发端到端的神经网络架构，如基于Transformer的序列模型或视觉-动作耦合模型，以提升策略的泛化性能。同时，数据集也促进了仿真到真实迁移、多任务学习等方向的算法探索，为机器人社区提供了可比较的基准，推动了开源机器人学习框架的进一步发展与完善。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集