five

eval2_grb_r_eval1prompt

收藏
Hugging Face2026-05-17 更新2026-05-18 收录
下载链接:
https://huggingface.co/datasets/robot-learning-group47/eval2_grb_r_eval1prompt
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用LeRobot工具创建,是一个用于机器人学习的演示数据集。数据集包含5个完整的情节(episodes),总计3000帧数据,涉及1个任务。数据以分块形式组织,包含结构化数据文件(Parquet格式)和视频文件(MP4格式)。数据集的核心特征包括:1)动作空间:6自由度机械臂的关节位置指令(肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置);2)观测空间:包含相同的6关节位置状态,以及来自前置摄像头的480x640分辨率、30fps的RGB视频流。此外,数据集还提供了时间戳、帧索引、情节索引、任务索引等元数据字段。该数据集适用于机器人模仿学习、强化学习、行为克隆等任务,特别是针对‘so_follower’类型机械臂的控制策略学习。数据集采用Apache-2.0许可证。
创建时间:
2026-05-17
原始信息汇总

数据集概述

数据集名称: eval2_grb_r_eval1prompt
数据集地址: https://huggingface.co/datasets/robot-learning-group47/eval2_grb_r_eval1prompt
许可证: Apache-2.0
任务类别: 机器人学 (Robotics)
创建工具: LeRobot (https://github.com/huggingface/lerobot)


数据集基本信息

字段
机器人类型 so_follower
总片段数 (Episodes) 5
总帧数 3000
总任务数 1
块大小 (Chunks Size) 1000
数据文件大小 100 MB
视频文件大小 200 MB
帧率 (FPS) 30
数据分割 train: 0:5 (全部用于训练)
代码版本 v3.0

数据特征

该数据集包含以下特征字段:

1. 动作 (action)

  • 数据类型: float32
  • 形状: [6]
  • 字段名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

2. 观察状态 (observation.state)

  • 数据类型: float32
  • 形状: [6]
  • 字段名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

3. 前视图像 (observation.images.front)

  • 数据类型: video
  • 形状: [480, 640, 3] (高 x 宽 x 通道)
  • 视频编码: av1
  • 像素格式: yuv420p
  • 帧率: 30
  • 通道数: 3
  • 无音频

4. 时间戳 (timestamp)

  • 数据类型: float32
  • 形状: [1]

5. 帧索引 (frame_index)

  • 数据类型: int64
  • 形状: [1]

6. 片段索引 (episode_index)

  • 数据类型: int64
  • 形状: [1]

7. 全局索引 (index)

  • 数据类型: int64
  • 形状: [1]

8. 任务索引 (task_index)

  • 数据类型: int64
  • 形状: [1]

数据文件结构

  • 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

当前未提供引用信息,显示为 [More Information Needed]


可视化

可通过 LeRobot 可视化工具查看该数据集: https://huggingface.co/spaces/lerobot/visualize_dataset?path=robot-learning-group47/eval2_grb_r

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集采用LeRobot框架构建,其核心目标在于为机器人操作任务提供标准化训练与评估数据。数据采集过程聚焦于单一任务场景,共收录5个完整轨迹(episode),总计包含3000帧数据,采样频率为30帧/秒。数据以分块方式存储,每个块容量为1000帧,伴随对应的视频文件共同归档。构建过程中,动作(action)与观测状态(observation.state)均被统一编码为六维浮点向量,涵盖机器人肩部、肘部、腕部及夹爪的位姿信息,确保数据的时间一致性与结构完整性。
特点
该数据集最显著的特点在于其高度精炼的结构与多模态融合能力。仅包含单一任务,但通过5个重复轨迹提供了足够的变异性以支撑模仿学习研究。特征设计上,不仅记录了精细的六自由度关节动作与状态,还同步采集了分辨率达640×480的RGB视频(observation.images.front),采用AV1编码以平衡画质与存储效率。此外,每个样本均附带时间戳(timestamp)、帧索引(frame_index)及剧集索引(episode_index),便于研究者进行时序建模与轨迹对齐分析。
使用方法
使用该数据集时,建议优先通过LeRobot内置的可视化工具进行数据预览,以直观理解任务场景与动作模式。在模型训练中,可将action字段作为控制目标,observation.state与video作为策略网络的输入,实现从视觉-状态到动作的端到端映射。数据已预分为训练集(splits中train: 0:5),支持直接加载使用。鉴于数据量较小(约100MB的Parquet文件与200MB的视频),适用于快速原型验证或小样本迁移学习实验,具体引用格式请参照Apache-2.0协议。
背景与挑战
背景概述
该数据集由robot-learning-group47研究团队基于LeRobot框架创建,属于机器人学习领域的示范数据集。其核心研究问题聚焦于通过示教学习(imitation learning)使机器人掌握特定操作技能,尤其是机械臂的跟随任务。数据集包含5个演示片段、共计3000帧图像及对应的六维动作与状态序列(涵盖肩、肘、腕及夹爪等关节信息),图像分辨率为640×480,帧率30fps。作为开源机器人数据集,它遵循Apache-2.0许可协议,为机器人操作策略的离线训练和评估提供了标准化数据基础,对推动低成本机器人学习研究具有重要参考价值。
当前挑战
该数据集所解决的领域挑战在于:机器人通过单纯视觉与运动示教高效学习连续控制策略,传统方法需昂贵仿真环境或大量手工编程。具体而言,数据集构建面临多重困难:一是动作空间的高维连续性与演示一致性的保持,需精确标定6自由度机械臂的位姿与夹爪状态;二是多模态数据(图像、状态、动作)的同步采集与对齐,视频帧率30fps与状态更新需严格时间戳匹配;三是小样本场景下的数据泛化问题,仅5个演示片段需应对任务变化与噪声干扰。此外,标注成本高、传感器噪声以及不同硬件配置下的迁移挑战亦构成显著障碍。
常用场景
经典使用场景
在机器人学习与模仿学习领域,eval2_grb_r_eval1prompt数据集为基于视觉的运动控制任务提供了精细化的训练与评估基准。该数据集通过LeRobot框架采集,包含5个完整演示回合、共计3000帧的高频时序数据,记录了一款名为so_follower的机械臂在30帧每秒的速率下执行的单一操作任务。每个训练样本均同步存储了六维关节空间的动作指令与状态观测,以及来自前视摄像头的480×640分辨率彩色视频流,这使其成为研究视觉-运动联合表征学习、行为克隆以及逆强化学习等经典范式的理想试验场。研究者可以利用这些多模态对齐数据,在端到端策略网络中训练从像素到低层控制指令的映射,从而复现或改进基于示范的机器人操控算法。
解决学术问题
该数据集的发布有效回应了机器人学习社区中长期存在的可重复性危机与数据稀缺困境。长期以来,不同实验室的机器人平台在硬件配置、传感器校准以及任务设计上的异质性,使得学术成果的横向对比困难重重。eval2_grb_r_eval1prompt依托Apache-2.0开源协议,以标准化的Parquet和视频文件格式提供结构化数据,为研究者提供了可控的对比基准。借助这一资源,学术界得以深入探究数据质量对模仿学习泛化能力的影响,量化分析示范多样性在抑制策略过拟合中的作用,并系统评估噪声环境下视觉编码器与运动规划器之间的协同机制。此外,该数据集所采用的高精度时序同步方案,也为后续研究因果推断在机器人序列决策中的应用搭建了坚实的实验平台。
衍生相关工作
围绕eval2_grb_r_eval1prompt数据集所代表的示范学习范式,学术界已衍生出一系列具有深远影响的工作,涵盖了分层模仿学习、多模态融合以及域随机化增强等前沿方向。基于此数据集中6维动作与视频的天然对齐结构,研究者发展了基于Transformer架构的时序动作分割与生成模型,实现了从原始像素到平滑轨迹的端到端生成。与此同时,利用该数据提供的毫米级精度前视图像与关节位置记录,相关团队构建了融合视觉特征与运动动力学的联合嵌入空间,为跨任务零样本泛化奠定了理论基础。在数据高效性方面,围绕该数据集进行的对比研究表明,结合隐式运动原语的扩散策略能够显著减少所需演示数量,这为后续少样本模仿学习领域的工作提供了关键的经验锚点。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作