five

eval_lego-block-front-only

收藏
Hugging Face2026-03-03 更新2026-03-04 收录
下载链接:
https://huggingface.co/datasets/vladivanovic/eval_lego-block-front-only
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,适用于机器人技术领域,采用apache-2.0许可证。数据集包含5个episodes,总计2180帧,涉及1个任务。数据以parquet格式存储,总数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集结构包括训练集划分(0:5),数据路径和视频路径分别指向parquet和mp4文件。特征字段包括动作(6个浮点型关节位置)、观测状态(6个浮点型关节位置)、前端图像观测(360x640x3的视频帧)、时间戳、帧索引、episode索引、索引和任务索引。图像观测的详细信息包括视频高度、宽度、编解码器、像素格式、是否为深度图、帧率、通道数和是否有音频。
创建时间:
2026-03-03
原始信息汇总

数据集概述

基本信息

  • 数据集名称: eval_lego-block-front-only
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache 2.0
  • 任务类别: 机器人学

数据集规模

  • 总情节数: 5
  • 总帧数: 2180
  • 总任务数: 1
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 30 FPS
  • 数据块大小: 1000

数据集结构

  • 数据文件格式: Parquet
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据划分: 训练集 (0:5)

特征字段

动作

  • 数据类型: float32
  • 形状: [6]
  • 维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

  • 数据类型: float32
  • 形状: [6]
  • 维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像(前视)

  • 数据类型: 视频
  • 形状: [360, 640, 3] (高度, 宽度, 通道)
  • 视频信息:
    • 高度: 360
    • 宽度: 640
    • 编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: 否
    • 帧率: 30
    • 通道数: 3
    • 包含音频: 否

元数据

  • 时间戳: float32, 形状 [1]
  • 帧索引: int64, 形状 [1]
  • 情节索引: int64, 形状 [1]
  • 索引: int64, 形状 [1]
  • 任务索引: int64, 形状 [1]

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so_follower

缺失信息

  • 主页: 未提供
  • 论文: 未提供
  • 引用格式 (BibTeX): 未提供
搜集汇总
数据集介绍
构建方式
在机器人操作领域,高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。eval_lego-block-front-only数据集依托LeRobot开源框架构建,通过实际机器人交互采集了五个完整任务片段,总计2180帧数据。该数据集以Parquet格式存储,采用分块结构组织,每块约1000帧,确保了数据的高效读取与处理。数据采集过程中,机器人执行特定任务,同步记录关节位置、前视图像及时间戳等多模态信息,为算法训练提供了丰富的时空上下文。
特点
该数据集的核心特征在于其精心设计的多模态数据结构。动作空间与观测状态均以六维浮点向量表示,精确捕捉了机器人肩部、肘部、腕部及夹爪的关节位置。前视图像以360x640分辨率的三通道视频形式存储,帧率为30fps,采用AV1编码,平衡了视觉质量与存储效率。数据集还包含了帧索引、片段索引等元数据,支持按时间步或任务片段进行灵活的数据切片与重组,为时序建模提供了便利。
使用方法
使用该数据集时,研究者可通过LeRobot框架或兼容的数据加载工具直接读取Parquet文件。数据按训练集划分,涵盖全部五个任务片段,适用于机器人策略评估与验证。典型应用包括加载关节动作与观测状态以训练模仿学习模型,或结合前视图像序列进行端到端的视觉运动控制算法开发。数据集的标准化格式确保了与主流机器学习库的无缝集成,支持批量加载与实时流式处理,加速实验迭代过程。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习等范式的发展亟需高质量、结构化的真实世界交互数据集作为支撑。eval_lego-block-front-only数据集应运而生,它由HuggingFace的LeRobot项目团队创建,专注于机器人操作任务的数据收集与评估。该数据集的核心研究问题在于如何通过有限的视觉观测(仅前向摄像头)与关节状态信息,使机器人能够学习并执行复杂的积木操作任务,从而推动具身智能在非结构化环境中的泛化能力。尽管其创建时间与具体研究人员信息在现有文档中尚未明确披露,但作为LeRobot生态系统的一部分,该数据集旨在为社区提供一个标准化的基准,以评估机器人策略在真实物理交互中的表现,对机器人操控技能的自动化学习具有重要的参考价值。
当前挑战
该数据集旨在解决机器人操作任务中的视觉-动作映射挑战,特别是在仅依赖单一前向视觉输入的情况下,如何准确理解场景几何与物体关系,并生成精确的关节控制指令以完成积木组装等精细操作。这一领域问题的核心挑战在于视觉观测的歧义性、动作序列的长时依赖建模,以及从仿真到真实世界的域适应难题。在构建过程中,数据采集面临诸多实际困难,包括机器人硬件控制的高精度同步需求、多模态传感器数据(如图像、关节状态、时间戳)的大规模高效存储与对齐,以及确保任务轨迹的多样性与覆盖度以支持稳健的策略学习。此外,数据标注与质量验证在真实物理交互中成本高昂,如何平衡数据规模与标注可靠性亦是构建过程中的关键挑战。
常用场景
经典使用场景
在机器人学习领域,eval_lego-block-front-only数据集为模仿学习与强化学习算法的评估提供了关键基准。该数据集通过记录机械臂执行乐高积木堆叠任务时的关节位置、状态及前视图像,构建了多模态交互序列。研究者可利用这些数据训练模型学习从视觉输入到动作输出的映射,验证算法在真实物理环境中的泛化能力与鲁棒性。
实际应用
在实际工业与家庭服务场景中,该数据集可直接应用于自动化装配或物品整理系统的开发。基于数据驱动的模型能够学习类似乐高堆叠的精细操作技能,提升机械臂在非结构化环境中的适应性。此类技术可延伸至物流分拣、医疗辅助等领域,实现低成本、高灵活性的机器人解决方案,降低对精确预编程的依赖。
衍生相关工作
围绕该数据集,已衍生出多项专注于视觉运动控制的经典研究。例如,基于时空注意力的策略网络利用其视频序列学习长期依赖关系;逆强化学习方法从演示轨迹中推断奖励函数,以优化堆叠行为。这些工作进一步扩展了数据集的用途,促进了机器人学习社区在行为克隆、分层强化学习等方向上的算法创新与性能突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作