eval_lego_sorter_v2
收藏Hugging Face2026-04-09 更新2026-04-10 收录
下载链接:
https://huggingface.co/datasets/muyao-liu/eval_lego_sorter_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集采用Apache-2.0许可证,专注于机器人技术领域,与LeRobot项目相关。数据集结构包含元数据信息,如代码库版本(v3.0)、机器人类型(so_follower)、数据文件大小(100MB)、视频文件大小(200MB)和帧率(30fps)。数据集特征包括动作(action)、观察状态(observation.state)、观察图像(observation.images.front)、时间戳(timestamp)、帧索引(frame_index)、片段索引(episode_index)、索引(index)和任务索引(task_index),详细描述了各字段的数据类型和形状。数据集适用于机器人控制和视觉任务的研究与应用。
创建时间:
2026-04-09
原始信息汇总
数据集概述
基本信息
- 数据集名称: eval_lego_sorter_v2
- 发布者: muyao-liu
- 许可证: Apache License 2.0
- 任务类别: 机器人学
- 标签: LeRobot
- 创建工具: 使用 LeRobot 创建
数据集结构
- 数据格式: Parquet 文件
- 数据文件路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4 - 分块大小: 1000 帧
- 帧率: 30 FPS
数据特征
- 动作: 包含6个浮点数值,分别对应机器人关节位置。
- 观测状态: 包含6个浮点数值,分别对应机器人关节位置。
- 观测图像: 来自前置摄像头,分辨率为 480x640,3通道。
- 时间戳: 单精度浮点数。
- 帧索引: 64位整数。
- 回合索引: 64位整数。
- 数据索引: 64位整数。
- 任务索引: 64位整数。
数据规模
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 总回合数: 0
- 总帧数: 0
- 总任务数: 0
配置信息
- 代码库版本: v3.0
- 机器人类型: so_follower
可视化
- 可视化空间: https://huggingface.co/spaces/lerobot/visualize_dataset?path=muyao-liu/eval_lego_sorter_v2
引用信息
- 论文: 未提供
- BibTeX引用: 未提供
搜集汇总
数据集介绍

构建方式
在机器人操作领域,eval_lego_sorter_v2数据集依托LeRobot平台构建而成,其数据采集过程通过so_follower型机器人系统实现。该数据集以结构化方式组织,原始数据被分割为多个块,每块包含1000个数据点,并以Parquet格式存储,确保了高效的数据压缩与读取性能。数据采集过程中,机器人执行乐高积木分拣任务,同步记录关节位置、图像观测及时间戳等多模态信息,形成了连贯的交互轨迹。
特点
本数据集在机器人感知与控制方面展现出显著特点,其核心特征在于融合了高维动作指令与丰富的观测数据。动作空间涵盖六自由度机械臂的关节位置控制,观测部分则整合了机器人本体状态与前向摄像头采集的480x640分辨率RGB图像序列,帧率稳定在30fps。数据以分块索引机制组织,支持按帧、按片段或按任务灵活访问,为模仿学习与强化学习算法提供了多粒度、时序对齐的训练样本。
使用方法
研究者可利用该数据集进行机器人策略学习与评估任务。通过加载Parquet格式的数据文件,用户可以提取特定片段或时间步的动作-观测对,用于训练端到端的控制模型。数据集内置的索引结构允许按episode_index或frame_index快速定位轨迹片段,便于进行离线强化学习或行为克隆实验。同时,配套的视频文件为视觉表征学习提供了真实场景下的图像序列,支持算法在仿真与真实迁移中的性能验证。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的发展亟需高质量、结构化的真实世界交互数据集作为支撑。eval_lego_sorter_v2数据集应运而生,它由HuggingFace的LeRobot项目团队创建,旨在为机器人操作任务,特别是涉及灵巧抓取与分类的评估场景,提供标准化的基准数据。该数据集聚焦于解决机器人对乐高积木等小型物体进行识别、抓取与分类的复杂操作问题,通过整合多模态观测信息(如关节状态与前端视觉图像)与对应的机械臂动作指令,为算法在真实物理环境中的泛化能力与鲁棒性评估提供了关键资源,对推动具身智能与自动化分拣系统的研究具有显著影响力。
当前挑战
该数据集致力于应对机器人操作中多模态感知与精细动作协同的固有挑战,例如在动态环境中实现高精度物体抓取与稳定分类。具体而言,其构建过程面临诸多困难:首先,真实机器人数据采集需确保动作指令与视觉观测在时序上的严格同步,任何延迟或错位都将影响学习信号的有效性;其次,处理高维视频数据与连续动作空间对存储效率与数据标注提出了严峻要求;此外,模拟环境与真实物理系统间的域差异使得采集的数据需具备高度的真实性与多样性,以支撑模型在未见场景中的可靠评估,这进一步增加了数据收集与整理的复杂性。
常用场景
经典使用场景
在机器人操作领域,eval_lego_sorter_v2数据集为模仿学习与强化学习算法的评估提供了标准化基准。该数据集通过记录机械臂在乐高积木分拣任务中的关节位置、夹爪状态以及前置摄像头捕捉的视觉图像,构建了多模态交互序列。研究者能够利用这些轨迹数据训练端到端策略模型,验证算法在复杂物体操控场景下的泛化能力与鲁棒性。
实际应用
在工业自动化与柔性制造场景中,该数据集所对应的乐高分拣任务模拟了实际生产线上的零件识别与分类需求。基于此类数据训练的模型可迁移至电子元件装配、药品分装或物流包裹分拣等实际工序,提升机器人对非结构化环境的适应能力。其多模态数据采集方式也为开发具备视觉反馈的自主操控系统提供了关键技术支持。
衍生相关工作
围绕该数据集衍生的经典研究主要集中在视觉运动策略学习领域。例如,基于时空注意力机制的轨迹预测模型、结合逆动力学与对比学习的表示学习方法,以及跨模态对齐的模仿学习框架等。这些工作通过利用数据集中同步记录的关节运动与视觉流,推动了机器人操作中状态估计、动作生成与任务规划等子方向的协同发展。
以上内容由遇见数据集搜集并总结生成



