five

eval_pick_and_place

收藏
Hugging Face2026-01-18 更新2026-01-19 收录
下载链接:
https://huggingface.co/datasets/ddubbae/eval_pick_and_place
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人数据集,包含机器人动作和观察数据,如位置信息和前后摄像头图像。数据集结构包括parquet文件,具体特征涉及机器人的肩部、肘部、腕部和夹持器的位置,以及480x640分辨率的图像。元数据显示数据集与'so_follower'机器人类型相关,包含数据块大小、视频文件大小、帧率等详细信息。
创建时间:
2026-01-18
原始信息汇总

数据集概述

基本信息

  • 数据集名称: eval_pick_and_place
  • 托管地址: https://huggingface.co/datasets/ddubbae/eval_pick_and_place
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 许可证: Apache-2.0
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

  • 数据文件格式: Parquet
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 30 FPS
  • 机器人类型: so_follower
  • 代码库版本: v3.0

数据统计

  • 总情节数: 0
  • 总帧数: 0
  • 总任务数: 0

特征字段

  1. 动作

    • 数据类型: float32
    • 形状: [6]
    • 名称:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
  2. 观测状态

    • 数据类型: float32
    • 形状: [6]
    • 名称:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
  3. 观测图像(前视)

    • 数据类型: video
    • 形状: [480, 640, 3]
    • 维度名称:
      • height
      • width
      • channels
  4. 观测图像(侧视)

    • 数据类型: video
    • 形状: [480, 640, 3]
    • 维度名称:
      • height
      • width
      • channels
  5. 时间戳

    • 数据类型: float32
    • 形状: [1]
    • 名称: null
  6. 帧索引

    • 数据类型: int64
    • 形状: [1]
    • 名称: null
  7. 情节索引

    • 数据类型: int64
    • 形状: [1]
    • 名称: null
  8. 索引

    • 数据类型: int64
    • 形状: [1]
    • 名称: null
  9. 任务索引

    • 数据类型: int64
    • 形状: [1]
    • 名称: null

补充信息

  • 主页: 未提供
  • 论文: 未提供
  • 引用信息: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作领域,eval_pick_and_place数据集依托LeRobot平台构建,采用结构化数据采集流程。该数据集以Apache 2.0许可发布,通过机器人执行拾取与放置任务时记录多模态信息,包括关节位置、图像观测及时间序列数据。数据以分块Parquet格式存储,配合MP4视频文件,确保了高效存储与并行处理能力,为机器人学习研究提供了标准化数据基础。
特点
该数据集显著特点在于其丰富的多模态观测结构,同时整合了机器人本体状态与视觉信息。特征维度涵盖六自由度关节位置数据,以及分辨率为480x640的双视角RGB图像流,帧率稳定在30fps。数据结构中嵌入了完整的时空索引体系,包括时间戳、帧索引与任务标识,支持复杂时序分析与任务分解研究,为模仿学习与强化学习算法提供了高维度输入空间。
使用方法
研究者可通过HuggingFace数据集库直接加载该数据集,利用其预定义的特征结构进行模型训练。数据按分块组织便于流式读取,用户可依据episode_index或task_index进行任务划分,结合observation.state与action字段构建状态-动作对。视觉数据可通过video_path字段关联视频文件,实现多模态学习管道的端到端构建,适用于机器人策略评估与行为克隆等研究场景。
背景与挑战
背景概述
在机器人操作领域,模仿学习与强化学习的研究长期致力于提升机械臂执行复杂任务的能力,例如精准的抓取与放置。eval_pick_and_place数据集应运而生,由LeRobot团队基于其开源平台构建,旨在为机器人策略评估提供标准化基准。该数据集聚焦于机械臂的拾放操作,通过整合多视角视觉观测与关节状态数据,为算法开发人员提供了丰富的交互轨迹,以推动机器人自主操作技术的进步。
当前挑战
该数据集旨在解决机器人操作中策略泛化与评估的挑战,即如何确保学习模型在动态环境中稳定执行拾放任务。构建过程中的挑战包括多模态数据的高效同步与对齐,例如前端与侧方摄像头视频流与关节动作序列的精确匹配,以及大规模轨迹数据的存储与处理,需平衡数据规模与计算资源。
常用场景
经典使用场景
在机器人操作领域,eval_pick_and_place数据集为机器人抓取与放置任务提供了丰富的实验数据。该数据集通过记录机械臂的关节位置、夹爪状态以及多视角图像序列,构建了一个模拟真实环境的交互场景。研究人员能够利用这些数据训练端到端的视觉运动策略,使机器人学习从感知到动作的映射关系,从而完成物品的拾取、移动和精准放置等复杂操作。
衍生相关工作
围绕该数据集,学术界衍生了一系列经典研究工作,包括基于视觉的抓取姿态预测、多模态策略蒸馏以及跨领域迁移学习等。这些工作通常利用数据集的图像与动作序列,开发出鲁棒的神经网络架构,如时空注意力模型和分层强化学习框架,进一步拓展了机器人操作智能的边界。
数据集最近研究
最新研究方向
在机器人操作领域,eval_pick_and_place数据集作为LeRobot框架下的关键资源,正推动着基于视觉的端到端强化学习研究。该数据集整合了多视角图像、关节状态与动作序列,为模仿学习与离线强化学习算法提供了丰富的训练与评估基础。当前前沿探索聚焦于跨模态表征学习,旨在融合视觉观测与机器人本体感知,以提升在复杂非结构化环境中抓取与放置任务的泛化能力。随着具身智能与通用机器人技术的兴起,此类高质量仿真与真实世界数据融合的数据集,正成为加速机器人技能迁移与自适应控制研究的重要催化剂,为降低实际部署成本、推动自动化系统智能化奠定了数据基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作