five

pick_test_v5

收藏
Hugging Face2026-02-11 更新2026-02-12 收录
下载链接:
https://huggingface.co/datasets/arjunsinghyadav2/pick_test_v5
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是由LeRobot工具创建的机器人领域数据集,采用Apache 2.0许可协议。数据集包含机械臂控制相关的多模态数据,主要记录so_follower型机器人的运动状态。数据结构方面:包含1000帧为单位的parquet格式数据文件(总计100MB)和配套MP4视频文件(总计200MB),视频规格为1280×720分辨率30fps。核心特征字段包括:6自由度机械臂动作指令(shoulder_pan.pos等关节位置)、对应的6维状态观测值、前置摄像头视频流(720×1280×3 RGB格式),以及时间戳、帧索引、任务索引等元数据字段。所有数值字段均采用float32或int64数据类型。适用于机器人控制策略学习、行为克隆等研究场景。
创建时间:
2026-02-09
原始信息汇总

数据集概述

基本信息

  • 数据集名称: pick_test_v5
  • 托管平台: Hugging Face Datasets
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 许可证: Apache License 2.0

数据集详情

  • 主页: 信息缺失
  • 论文: 信息缺失
  • 引用信息: 信息缺失

数据集结构

  • 配置名称: default
  • 数据文件格式: Parquet
  • 数据文件路径模式: data/*/*.parquet
  • 元信息文件: meta/info.json

元信息摘要

  • 代码库版本: v3.0
  • 机器人类型: so_follower
  • 总情节数: 0
  • 总帧数: 0
  • 总任务数: 0
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 30 FPS
  • 数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

  • 动作

    • 数据类型: float32
    • 形状: [6]
    • 特征名:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
  • 观测状态

    • 数据类型: float32
    • 形状: [6]
    • 特征名:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
  • 观测图像 (前视)

    • 数据类型: video
    • 形状: [720, 1280, 3]
    • 维度名:
      • height
      • width
      • channels
  • 时间戳

    • 数据类型: float32
    • 形状: [1]
    • 特征名:
  • 帧索引

    • 数据类型: int64
    • 形状: [1]
    • 特征名:
  • 情节索引

    • 数据类型: int64
    • 形状: [1]
    • 特征名:
  • 索引

    • 数据类型: int64
    • 形状: [1]
    • 特征名:
  • 任务索引

    • 数据类型: int64
    • 形状: [1]
    • 特征名:
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,数据集的构建往往依赖于真实的硬件交互与系统化记录。pick_test_v5数据集借助LeRobot平台,通过so_follower型机器人采集了机械臂操作任务中的多模态数据。数据以Parquet格式分块存储,每块包含1000帧记录,涵盖了关节位置、图像观测及时间序列索引,确保了数据的结构化和高效访问。
特点
该数据集的特点在于其丰富的多模态表征,不仅包含六自由度机械臂的关节位置作为动作与状态观测,还整合了前端摄像头采集的720p RGB视频流。数据以30帧每秒的速率同步记录,提供了精确的时间戳、帧索引和任务索引,支持对长时序交互任务的细粒度分析。这种设计使得数据集适用于模仿学习与强化学习算法的训练与验证。
使用方法
使用该数据集时,研究者可通过LeRobot工具链加载数据,利用Parquet文件的分块结构高效读取特定片段。数据中的动作、状态和图像特征可直接用于训练机器人策略模型,而时间戳与索引信息便于对齐多模态信号或进行轨迹切片。数据集遵循Apache 2.0许可,允许广泛的学术与工业应用,包括行为克隆、离线强化学习等任务。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的研究依赖于高质量、大规模的真实世界交互数据。pick_test_v5数据集由HuggingFace的LeRobot项目创建,该项目致力于推动开源机器人学习框架的发展。该数据集聚焦于机械臂操作任务,特别是基于视觉的抓取与操控,其核心研究问题在于如何从异构传感器数据(如关节状态与前端摄像头图像)中学习有效的控制策略,以提升机器人在非结构化环境中的自主操作能力。尽管具体创建时间与主要研究人员信息尚未公开,但该数据集作为LeRobot生态系统的一部分,旨在为社区提供标准化的基准测试资源,促进机器人感知与控制算法的迭代与比较。
当前挑战
该数据集旨在解决机器人操作任务中的策略学习挑战,其核心问题在于如何从高维视觉观察与低维动作空间的映射中,实现精准、鲁棒的控制。具体挑战包括处理视觉观测中的遮挡、光照变化及背景干扰,以及协调多自由度机械臂的连续运动规划。在构建过程中,数据采集面临传感器同步、数据对齐与标注一致性的难题,同时需确保大规模视频与状态数据的存储效率与访问速度。此外,真实世界操作任务的多样性与复杂性要求数据集涵盖充分的任务变体,以支持泛化性评估,这对数据采集的广度与深度提出了较高要求。
常用场景
经典使用场景
在机器人学习领域,pick_test_v5数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集通过记录机械臂在拾取任务中的关节位置、视觉观察及时间戳等多模态数据,构建了连续动作与状态观测的对应关系。研究人员能够利用这些结构化轨迹,训练端到端的策略网络,使机器人学习从视觉输入到关节控制的映射,从而在仿真或真实环境中实现精准的物体抓取操作。
实际应用
在工业自动化与物流分拣等实际场景中,pick_test_v5数据集能够指导机器人系统的快速部署与适配。基于数据集训练的模型可应用于装配线上的零件抓取、仓库中的包裹搬运等任务,提升作业精度与效率。其开源特性降低了机器人编程的门槛,使中小型企业能够利用预训练模型进行二次开发,加速了智能机器人在柔性制造与服务业中的普及与应用落地。
衍生相关工作
围绕pick_test_v5数据集,已衍生出一系列专注于机器人技能学习的经典研究工作。例如,结合Transformer架构的序列建模方法被用于处理其时空轨迹数据,以提升长期动作预测的准确性;同时,生成对抗模仿学习等算法利用该数据集进行策略蒸馏,实现了从人类示范到机器人执行的技能迁移。这些工作进一步拓展了数据集中多模态信息的利用方式,为机器人自主操作系统的开发奠定了算法基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作