eval_pick_and_place

Hugging Face2026-04-16 更新2026-04-17 收录

下载链接：

https://huggingface.co/datasets/k-matsushima/eval_pick_and_place

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，主要用于机器人技术领域。数据集包含7个episodes，总计3633帧，涉及1个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集的结构包括动作数据（如肩部、肘部、腕部和夹持器的位置）、观察数据（包括状态和来自前部和腕部摄像头的图像）、时间戳、帧索引、episode索引和任务索引。前部和腕部摄像头图像的分辨率为480x640，3通道，视频编码为av1，像素格式为yuv420p，无音频。数据集采用Apache-2.0许可证，但缺少主页、论文和引用信息。

创建时间：

2026-04-15

原始信息汇总

数据集概述

基本信息

数据集名称: eval_pick_and_place
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总任务数: 1
总情节数: 118
总帧数: 70904
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 30 FPS
数据块大小: 1000
数据格式: Parquet
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
代码库版本: v3.0
机器人类型: so_follower
数据划分: 训练集 (0:118)

数据特征

action: 浮点32位数组，形状[6]，包含肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪的位置。
observation.state: 浮点32位数组，形状[6]，包含与action相同的关节位置状态。
observation.images.front: 视频数据，形状[480, 640, 3]，编码格式AV1，像素格式yuv420p，非深度图，无音频。
observation.images.wrist: 视频数据，形状[480, 640, 3]，编码格式AV1，像素格式yuv420p，非深度图，无音频。
timestamp: 浮点32位数组，形状[1]。
frame_index: 整型64位数组，形状[1]。
episode_index: 整型64位数组，形状[1]。
index: 整型64位数组，形状[1]。
task_index: 整型64位数组，形状[1]。

可视化

可视化地址: https://huggingface.co/spaces/lerobot/visualize_dataset?path=k-matsushima/eval_pick_and_place

引用信息

主页: 未提供
论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作领域，eval_pick_and_place数据集的构建依托于LeRobot框架，通过实际机器人系统采集了118个完整任务片段，总计70904帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了高效的数据管理与访问。采集过程中，机器人执行单一的拾取与放置任务，同时记录六维关节位置的动作指令、对应的状态观测以及来自前视与腕部摄像头的视觉信息，帧率稳定在30fps，为机器人学习提供了丰富的多模态交互轨迹。

特点

该数据集的核心特点在于其多模态融合的数据结构，不仅包含六自由度机械臂的关节位置作为动作与状态特征，还整合了前视与腕部双视角的高清视频流，分辨率达640x480，编码为AV1格式。数据以严格的时序对齐方式组织，每帧均附带时间戳、帧索引与片段索引，支持精确的时序分析。所有数据统一采用浮点32位或整型64位格式，确保了数值精度与计算效率，为机器人模仿学习与策略评估提供了标准化且信息密集的基准资源。

使用方法

使用eval_pick_and_place数据集时，研究者可通过LeRobot提供的可视化工具直观浏览数据内容，或直接加载Parquet文件进行程序化处理。数据按片段分块存储，路径遵循明确模式，便于按需索引。典型应用包括训练端到端的机器人操作模型，利用动作、状态与视觉观测的对应关系学习拾放策略；也可用于评估模仿学习算法的性能，通过回放真实机器人轨迹验证策略泛化能力。数据集兼容主流机器学习框架，支持从原始传感器数据到高层控制指令的完整流水线开发。

背景与挑战

背景概述

机器人操作领域长期致力于提升机械臂在非结构化环境中的自主决策与执行能力，其中拾放任务作为一项基础且关键的研究课题，对推动服务机器人、工业自动化等应用发展具有深远意义。eval_pick_and_place数据集由LeRobot团队构建，依托开源机器人学习平台LeRobot，旨在为机器人模仿学习与强化学习算法提供高质量、多模态的评估基准。该数据集收录了118个完整任务片段，涵盖超过七万帧的同步状态观测与动作数据，并整合了前视与腕部双视角视觉信息，为研究复杂场景下的机器人抓取策略与动作泛化性奠定了数据基础。

当前挑战

在机器人拾放任务中，核心挑战在于如何使模型从有限的演示数据中学习鲁棒且泛化的控制策略，以应对物体姿态多样性、环境遮挡及动态干扰等复杂条件。eval_pick_and_place数据集构建过程中，需克服多传感器数据的高精度同步、大规模视频流的高效压缩存储，以及动作轨迹与视觉观测间的时空对齐等技术难题。此外，确保数据采集的重复性与任务完成度的一致性，亦是保证数据集质量与算法评估可靠性的关键所在。

常用场景

经典使用场景

在机器人操作领域，eval_pick_and_place数据集为评估机器人抓取与放置任务提供了标准化的基准。该数据集通过记录机械臂的关节位置、夹爪状态以及来自前视和腕部摄像头的视觉信息，构建了多模态交互序列。研究者可利用这些数据训练端到端的模仿学习模型，使机器人能够从人类演示中学习精细的操作策略，从而在模拟或真实环境中执行物品抓取、移动和放置等复杂动作。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究工作，主要集中在模仿学习与强化学习的结合、视觉-动作联合建模以及跨域策略迁移等方面。例如，基于LeRobot框架的后续研究探索了如何利用此类多模态数据提升策略的鲁棒性和泛化性能。这些工作进一步拓展了数据驱动的机器人操作范式，为开源机器人社区提供了可扩展的算法与工具链。

数据集最近研究