five

pick_and_place

收藏
Hugging Face2026-03-29 更新2026-03-30 收录
下载链接:
https://huggingface.co/datasets/jimkola/pick_and_place
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,专注于机器人技术领域,采用apache-2.0许可证。数据集包含51个总剧集,18421帧,1个总任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集结构包括训练分割,数据以parquet格式存储,视频以mp4格式存储。特征包括动作(6个浮点型关节位置)、观察状态(6个浮点型关节位置)、观察图像(480x640x3的视频帧)、时间戳、帧索引、剧集索引、索引和任务索引。这些特征详细描述了机器人的状态和行为,适用于机器人控制和学习任务。
创建时间:
2026-03-29
原始信息汇总

数据集概述

基本信息

  • 数据集名称: pick_and_place
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学

数据集规模与结构

  • 总情节数: 51
  • 总帧数: 18421
  • 总任务数: 1
  • 帧率: 30 FPS
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 数据格式: Parquet
  • 视频格式: MP4 (编码: AV1, 像素格式: yuv420p)
  • 数据分割: 训练集 (0:51)

数据特征

动作空间

  • 特征名: action
  • 数据类型: float32
  • 形状: [6]
  • 维度名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测空间

状态观测

  • 特征名: observation.state
  • 数据类型: float32
  • 形状: [6]
  • 维度名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

图像观测

  • 特征名: observation.images.external
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称:
    • height
    • width
    • channels
  • 视频信息:
    • 高度: 480 像素
    • 宽度: 640 像素
    • 通道数: 3
    • 编解码器: av1
    • 是否为深度图: false
    • 帧率: 30 FPS
    • 包含音频: false

元数据

  • 时间戳: timestamp (float32, 形状 [1])
  • 帧索引: frame_index (int64, 形状 [1])
  • 情节索引: episode_index (int64, 形状 [1])
  • 索引: index (int64, 形状 [1])
  • 任务索引: task_index (int64, 形状 [1])

文件路径模式

  • 数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so_follower

缺失信息

  • 主页: 未提供
  • 论文: 未提供
  • 引用格式: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作领域,数据集的构建方式直接影响模型训练的效能。pick_and_place数据集借助LeRobot平台,通过实际机器人交互采集而成,涵盖了51个完整操作片段,总计18421帧数据。数据以分块形式存储于Parquet文件中,每块包含1000帧,确保了高效的数据管理与读取。同时,配套的视频文件以MP4格式保存,帧率为30fps,分辨率达640x480,为视觉感知研究提供了丰富的图像序列。
使用方法
使用pick_and_place数据集时,研究者可通过LeRobot提供的工具链直接加载数据。数据集已预分为训练集,涵盖全部51个片段,用户可依据帧索引或片段索引灵活提取所需数据。对于动作与状态数据,可直接从Parquet文件中读取浮点型数组;视觉数据则通过视频路径访问MP4文件,便于进行图像处理或特征提取。该数据集适用于训练端到端的机器人策略模型,或用于验证感知-动作映射算法的性能,为机器人抓取与放置任务的研究提供实证支持。
背景与挑战
背景概述
在机器人操作领域,灵巧的抓取与放置任务长期被视为评估智能体环境交互能力的关键基准。pick_and_place数据集由LeRobot项目团队构建,依托Apache 2.0开源协议发布,旨在为机器人学习研究提供高质量的真实世界交互数据。该数据集聚焦于单一任务场景,收录了51个完整交互片段,涵盖超过18000帧的时序记录,整合了六自由度机械臂的关节状态、外部视觉观测及精确的时间戳信息。其核心研究问题在于如何通过大规模真实数据驱动策略学习,以提升机器人在非结构化环境中的自主操作泛化能力,对推动模仿学习与强化学习在实体机器人上的应用具有显著影响力。
当前挑战
该数据集致力于解决机器人操作中抓取与放置任务的泛化性挑战,其核心难点在于如何从有限的任务演示中学习能够适应物体形态、位置及环境动态变化的鲁棒策略。构建过程中面临多重挑战:数据采集需在真实物理系统中同步记录高维关节动作与多模态观测,确保时序对齐与传感器校准的精确性;原始数据规模庞大,涉及视频流与状态信息的高效压缩与存储;此外,标注过程依赖精确的帧索引与任务分段,以维持动作-观测对的完整性,为后续算法训练提供可靠支撑。
常用场景
经典使用场景
在机器人操作领域,pick_and_place数据集为机械臂抓取与放置任务提供了丰富的演示数据。该数据集通过记录六自由度机械臂的关节位置、夹爪状态以及外部摄像头图像,构建了从感知到动作的完整序列。研究人员利用这些数据训练模仿学习或强化学习模型,使机器人能够学习如何精准地抓取物体并将其移动到指定位置,从而模拟工业装配或物流分拣中的核心操作。
解决学术问题
该数据集有效应对了机器人学中样本效率低下与泛化能力不足的挑战。通过提供真实世界的操作轨迹与视觉观测,它支持端到端策略学习的研究,减少了在仿真环境中训练导致的现实差距。其结构化特征有助于探索多模态感知与运动控制的耦合机制,为提升机器人在非结构化环境中的自主操作能力奠定了数据基础。
实际应用
在实际工业与服务业场景中,pick_and_place数据集能够指导自动化系统的开发与优化。基于此数据训练的模型可应用于电子制造中的元件装配、仓储物流的货物搬运,乃至家庭服务机器人的物品整理。这些应用不仅提高了生产效率和操作精度,还降低了人工成本,推动了智能机器人技术在现实任务中的落地与普及。
数据集最近研究
最新研究方向
在机器人操作领域,pick_and_place数据集凭借其包含的关节位置、视觉图像及时间序列等多模态数据,正成为推动模仿学习与强化学习融合研究的关键资源。当前前沿探索聚焦于利用此类数据训练端到端策略模型,以提升机械臂在复杂环境中的抓取与放置泛化能力。随着开源机器人平台LeRobot的普及,该数据集促进了社区在真实世界技能迁移方面的协作,加速了从仿真到实际应用的突破,对柔性制造与家庭服务自动化具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作