eval_pick_and_place

Hugging Face2026-01-18 更新2026-01-19 收录

下载链接：

https://huggingface.co/datasets/ddubbae/eval_pick_and_place

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人数据集，包含机器人动作和观察数据，如位置信息和前后摄像头图像。数据集结构包括parquet文件，具体特征涉及机器人的肩部、肘部、腕部和夹持器的位置，以及480x640分辨率的图像。元数据显示数据集与'so_follower'机器人类型相关，包含数据块大小、视频文件大小、帧率等详细信息。

创建时间：

2026-01-18

原始信息汇总

数据集概述

基本信息

数据集名称: eval_pick_and_place
托管地址: https://huggingface.co/datasets/ddubbae/eval_pick_and_place
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
机器人类型: so_follower
代码库版本: v3.0

数据统计

总情节数: 0
总帧数: 0
总任务数: 0

特征字段

动作
- 数据类型: float32
- 形状: [6]
- 名称:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
观测状态
- 数据类型: float32
- 形状: [6]
- 名称:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
观测图像（前视）
- 数据类型: video
- 形状: [480, 640, 3]
- 维度名称:
  - height
  - width
  - channels
观测图像（侧视）
- 数据类型: video
- 形状: [480, 640, 3]
- 维度名称:
  - height
  - width
  - channels
时间戳
- 数据类型: float32
- 形状: [1]
- 名称: null
帧索引
- 数据类型: int64
- 形状: [1]
- 名称: null
情节索引
- 数据类型: int64
- 形状: [1]
- 名称: null
索引
- 数据类型: int64
- 形状: [1]
- 名称: null
任务索引
- 数据类型: int64
- 形状: [1]
- 名称: null

补充信息

主页: 未提供
论文: 未提供
引用信息: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作领域，eval_pick_and_place数据集依托LeRobot平台构建，采用结构化数据采集流程。该数据集以Apache 2.0许可发布，通过机器人执行拾取与放置任务时记录多模态信息，包括关节位置、图像观测及时间序列数据。数据以分块Parquet格式存储，配合MP4视频文件，确保了高效存储与并行处理能力，为机器人学习研究提供了标准化数据基础。

特点

该数据集显著特点在于其丰富的多模态观测结构，同时整合了机器人本体状态与视觉信息。特征维度涵盖六自由度关节位置数据，以及分辨率为480x640的双视角RGB图像流，帧率稳定在30fps。数据结构中嵌入了完整的时空索引体系，包括时间戳、帧索引与任务标识，支持复杂时序分析与任务分解研究，为模仿学习与强化学习算法提供了高维度输入空间。

使用方法

研究者可通过HuggingFace数据集库直接加载该数据集，利用其预定义的特征结构进行模型训练。数据按分块组织便于流式读取，用户可依据episode_index或task_index进行任务划分，结合observation.state与action字段构建状态-动作对。视觉数据可通过video_path字段关联视频文件，实现多模态学习管道的端到端构建，适用于机器人策略评估与行为克隆等研究场景。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的研究长期致力于提升机械臂执行复杂任务的能力，例如精准的抓取与放置。eval_pick_and_place数据集应运而生，由LeRobot团队基于其开源平台构建，旨在为机器人策略评估提供标准化基准。该数据集聚焦于机械臂的拾放操作，通过整合多视角视觉观测与关节状态数据，为算法开发人员提供了丰富的交互轨迹，以推动机器人自主操作技术的进步。

当前挑战

该数据集旨在解决机器人操作中策略泛化与评估的挑战，即如何确保学习模型在动态环境中稳定执行拾放任务。构建过程中的挑战包括多模态数据的高效同步与对齐，例如前端与侧方摄像头视频流与关节动作序列的精确匹配，以及大规模轨迹数据的存储与处理，需平衡数据规模与计算资源。

常用场景

经典使用场景

在机器人操作领域，eval_pick_and_place数据集为机器人抓取与放置任务提供了丰富的实验数据。该数据集通过记录机械臂的关节位置、夹爪状态以及多视角图像序列，构建了一个模拟真实环境的交互场景。研究人员能够利用这些数据训练端到端的视觉运动策略，使机器人学习从感知到动作的映射关系，从而完成物品的拾取、移动和精准放置等复杂操作。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究工作，包括基于视觉的抓取姿态预测、多模态策略蒸馏以及跨领域迁移学习等。这些工作通常利用数据集的图像与动作序列，开发出鲁棒的神经网络架构，如时空注意力模型和分层强化学习框架，进一步拓展了机器人操作智能的边界。

数据集最近研究