five

eval2_bgr_g

收藏
Hugging Face2026-05-14 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/robot-learning-group47/eval2_bgr_g
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot工具创建的机器人学习数据集,包含4条完整轨迹(episodes),共计2400帧数据,全部划分为训练集。数据采用分块存储,包括约100MB的结构化数据文件(Parquet格式)和200MB的视频文件(MP4格式)。核心特征包括:动作空间为6维浮点向量,用于控制机械臂的肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置;状态观测为与动作空间相同的6维关节位置向量;图像观测来自前置摄像头的RGB视频,分辨率为640x480,帧率30fps,编码格式为AV1;元数据包括时间戳、帧索引、轨迹索引、任务索引等。数据集适用于机器人模仿学习、行为克隆、视觉运动控制等任务的研究与开发,具体针对so_follower类型的机器人平台,并遵循Apache-2.0许可证。

This dataset is a robot learning dataset created using the LeRobot tool, containing 4 complete episodes with a total of 2400 frames, all allocated to the training set. The data is stored in chunks, including approximately 100MB of structured data files (Parquet format) and 200MB of video files (MP4 format). Key features include: an action space of a 6-dimensional floating-point vector controlling the robot arms shoulder translation, shoulder lift, elbow flexion, wrist flexion, wrist rotation, and gripper position; state observations as the same 6-dimensional joint position vector as the action space; image observations from a front-facing camera in RGB video format with a resolution of 640x480, a frame rate of 30fps, and AV1 encoding; metadata including timestamps, frame indices, episode indices, task indices, etc. The dataset is suitable for research and development in robot imitation learning, behavior cloning, visual-motor control, and other tasks, specifically targeting the so_follower type of robot platform, and follows the Apache-2.0 license.
创建时间:
2026-05-14
原始信息汇总

数据集概述

数据集名称:eval2_bgr_g

许可证:Apache-2.0

任务类别:机器人学 (Robotics)

标签:LeRobot

数据集基本信息

  • 数据集来源:使用 LeRobot 创建
  • 机器人类型:so_follower
  • 总片段数:4
  • 总帧数:2400
  • 总任务数:1
  • 帧率:30 FPS
  • 数据文件大小:约 100 MB
  • 视频文件大小:约 200 MB
  • 块大小:1000 帧
  • 版本:v3.0

数据集划分

  • 训练集:片段 0 至 3(共 4 个片段)
  • 验证集/测试集:无明确划分

数据集特征

动作特征 (action)

  • 数据类型:float32
  • 名称:6 个关节位置(shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos)
  • 形状:[6]

观测状态 (observation.state)

  • 数据类型:float32
  • 名称:与动作特征相同的 6 个关节位置
  • 形状:[6]

观测图像 (observation.images.front)

  • 数据类型:视频
  • 分辨率:480 × 640 像素
  • 通道数:3(RGB)
  • 视频编码:AV1
  • 像素格式:yuv420p
  • 帧率:30 FPS
  • 非深度图

其他特征

  • timestamp:时间戳,float32 类型,形状 [1]
  • frame_index:帧索引,int64 类型,形状 [1]
  • episode_index:片段索引,int64 类型,形状 [1]
  • index:索引,int64 类型,形状 [1]
  • task_index:任务索引,int64 类型,形状 [1]

数据存储结构

  • 数据路径data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

可视化

可使用 LeRobot 可视化工具 查看该数据集的具体内容。

搜集汇总
数据集介绍
main_image_url
构建方式
eval2_bgr_g数据集基于LeRobot框架构建,专为机器人学习任务设计。该数据集记录了4个完整操作轨迹,共计2400帧数据,帧率为30fps。数据以Parquet格式存储,每帧包含6维动作指令与6维观测状态,涵盖肩部、肘部、腕部及夹爪的位姿信息。同时,数据集同步采集了640×480分辨率的前置摄像头视频流,采用AV1编码压缩,为多模态学习提供了视觉观测信息。数据按1000帧为单位划分为块,便于高效存取与训练。
特点
该数据集具备鲜明的结构化特点,总规模约300MB,其中视频数据占据200MB。所有数据均采用标准化格式,支持通过LeRobot可视化工具进行交互预览。特征设计上,动作空间与观测空间严格对齐,均为6维浮点向量,确保了模仿学习中的输入输出一致性。视频数据独立存储为MP4文件,并通过元数据与帧序列建立关联,避免了冗余存储。此外,数据集包含精确的时间戳与索引字段,便于时序建模与轨迹回放。
使用方法
研究者可通过LeRobot库直接加载该数据集,利用其内置的数据加载器将Parquet文件与视频流自动同步。使用时需指定数据路径及chunks_size参数(推荐1000帧/块),系统将按训练集(全部4个轨迹)返回对齐后的动作、状态与图像序列。可视化过程中,可调用HuggingFace Spaces上的专用界面,交互查看各轨迹的观测影像与机械臂运动轨迹。对于模型训练,建议采用批量加载方式,利用frame_index和episode_index字段实现时序切片与轨迹重组。
背景与挑战
背景概述
该数据集由robot-learning-group47团队创建,依托LeRobot框架构建,旨在为机器人操控任务提供标准化的训练与评估数据。数据集聚焦于单任务模仿学习场景,记录了SO Follower机械臂在单一任务下的4个完整轨迹,包含2400帧状态、动作与视觉信息。其设计体现了从仿真到现实迁移中数据高效性的迫切需求,通过紧凑的轨迹结构和多模态特征(6维关节状态与640×480 RGB图像)为策略学习奠定基础。尽管规模有限,该数据集在推动低成本、可复现的机器人学习研究中具有潜在价值,尤其适用于验证小样本模仿学习算法在真实硬件上的可行性。
当前挑战
核心挑战在于以极少量轨迹(4条)应对机器人操控中高维状态-动作空间的策略泛化问题,环境噪声与运动学差异易导致过拟合。构建过程中需解决多模态数据同步难题,确保30Hz下动作指令与视觉反馈的时间对齐精度;同时处理AV1编码视频流的实时压缩与解压效率,避免数据加载瓶颈。此外,单一任务与固定硬件配置限制了数据集的迁移适用性,如何从稀疏演示中提取鲁棒的基元动作(如抓取闭环比)仍是典型示范学习困境,亟需结合跨数据集增量学习或域随机化技术突破规模瓶颈。
常用场景
经典使用场景
在机器人学习与模仿学习领域,eval2_bgr_g数据集专为双臂协作场景下的精细操控任务而设计。该数据集通过LeRobot框架采集,包含四段完整操作轨迹,每段以30帧每秒的频率记录机器人末端执行器的六维关节角度变化(包括肩部、肘部、腕部及夹爪的位姿),并同步存储前视摄像头拍摄的640×480像素高清RGB视频。研究者通常利用该数据集训练基于视觉的模仿学习模型,例如行为克隆或逆强化学习算法,使机器人能够从人类示教中习得诸如抓取、放置或装配等连贯动作,尤其适用于泛化性能要求较高的柔性生产线或医疗辅助操作场景。
解决学术问题
该数据集有效回应了机器人操作中'少样本模仿学习'与'跨场景泛化'两大核心挑战。传统方法依赖数十万条标注轨迹,而eval2_bgr_g凭借紧凑的四条示范轨迹,验证了在数据稀缺条件下模型仍能捕获动态操作策略。通过统一记录关节运动与视觉观测,它解决了多模态信息对齐难题——动作序列需与摄像头图像中的物体状态实时耦合。此外,数据集的公开化推动了机器人领域内标准化评估基准的建立,使不同算法(如扩散策略、Transformer-based策略)能在同等输入条件下比较性能,从而加速了高效学习范式的探索。
衍生相关工作
基于eval2_bgr_g的发布,衍生出多项推动算法鲁棒性提升的研究工作。例如,研究者利用其视频-动作对齐结构开发了时序对比学习框架,通过自监督方式增强模型对观测噪声的抵抗能力;另有工作将数据转换至多模态扩散模型空间,实现轨迹规划的动态纠错。此外,该数据集与LeRobot生态链的紧密结合催生了'imitation learning with data augmentation'方向,即通过随机化光照、背景或物体姿态扩充有限示范,显著提升了策略在虚实迁移中的成功率。这些工作共同彰显了该数据集在激发机器人学习新范式中的基石作用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作