five

pick_green_block_into_box

收藏
Hugging Face2026-04-19 更新2026-04-20 收录
下载链接:
https://huggingface.co/datasets/Elvinky/pick_green_block_into_box
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,适用于机器人技术领域,特别是涉及双手操作的任务。数据集采用apache-2.0许可证,包含102个episodes,总计44367帧,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集结构包括动作、观察状态、右腕和右前图像等多个特征,每个特征都有详细的数据类型、形状和名称描述。数据以parquet格式存储,适用于机器人控制、行为模仿等任务。

This dataset was developed using LeRobot, targeting the field of robotics, especially tasks involving bimanual manipulation. It is licensed under the Apache-2.0 license, and contains 102 episodes with a total of 44,367 frames. The data files have a size of 100 MB, while the video files occupy 200 MB, with a frame rate of 30 fps. The dataset structure includes multiple features such as actions, observation states, right wrist images and right front camera images, etc. Each feature is provided with detailed descriptions of its data type, shape and name. The data is stored in Parquet format, and is suitable for tasks like robot control and behavior imitation.
创建时间:
2026-04-16
原始信息汇总

数据集概述

基本信息

  • 数据集名称: pick_green_block_into_box
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot, so101, bimanual, lerobot

数据集结构

  • 总任务数: 1
  • 总情节数: 102
  • 总帧数: 44367
  • 数据分割: 训练集 (0:102)
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 30 FPS
  • 代码库版本: v3.0
  • 机器人类型: so_follower

数据特征

动作空间

  • 特征名: action
  • 数据类型: float32
  • 形状: [6]
  • 维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测空间

状态观测

  • 特征名: observation.state
  • 数据类型: float32
  • 形状: [6]
  • 维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

图像观测

右腕摄像头
  • 特征名: observation.images.right_wrist
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称: height, width, channels
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 编解码器: h264
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 帧率: 30
    • 通道数: 3
    • 包含音频: false
右前摄像头
  • 特征名: observation.images.right_front
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称: height, width, channels
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 编解码器: h264
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 帧率: 30
    • 通道数: 3
    • 包含音频: false

元数据特征

  • timestamp: float32, 形状 [1]
  • frame_index: int64, 形状 [1]
  • episode_index: int64, 形状 [1]
  • index: int64, 形状 [1]
  • task_index: int64, 形状 [1]

文件结构

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

可视化

  • 可视化空间: https://huggingface.co/spaces/lerobot/visualize_dataset?path=Elvinky/pick_green_block_into_box

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX引用: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作领域,高质量的数据集对于推动智能体学习复杂任务至关重要。pick_green_block_into_box数据集依托LeRobot平台构建,通过实际机器人系统采集了102个完整任务执行序列,总计包含44367帧数据。数据以分块形式存储于Parquet文件中,每个块包含1000帧,确保了高效的数据管理与访问。采集过程中,机器人执行单一的“拾取绿色积木放入盒子”任务,同步记录关节位置、图像观测及时间戳等多模态信息,为后续的模仿学习或强化学习算法提供了丰富的训练素材。
使用方法
为有效利用该数据集进行机器人学习研究,用户可通过HuggingFace平台直接访问并加载Parquet格式的数据文件。数据已预分为训练集,涵盖全部102个任务序列,研究者可以按帧或按片段提取关节位置、图像观测及对应动作标签。结合LeRobot提供的可视化工具,能够直观审视任务执行过程。典型应用包括训练端到端的策略网络,或构建状态-动作映射模型,以提升机器人在类似抓取放置任务中的泛化能力与操作精度。
背景与挑战
背景概述
在机器人操作领域,模仿学习与强化学习的发展亟需高质量、结构化的真实世界交互数据集作为支撑。pick_green_block_into_box数据集由HuggingFace的LeRobot项目团队创建,旨在为双臂机器人(so_follower类型)的物体抓取与放置任务提供示范数据。该数据集收录了102个完整操作序列,包含超过4.4万帧的多视角视觉观测与关节动作记录,核心研究问题聚焦于如何通过端到端的学习范式,使机器人能够精准执行将绿色积木块放入指定箱体的复杂操作流程。此类数据集的构建,为机器人自主技能学习提供了宝贵的实证基础,推动了具身智能在结构化环境中的实际应用。
当前挑战
该数据集致力于解决机器人操作中基于视觉的精细抓取与放置任务的泛化性挑战,其核心难点在于如何从高维视觉输入中提取鲁棒的特征表示,并生成连续、稳定且物理可行的关节控制序列。在构建过程中,面临多重技术挑战:数据采集需确保双臂机器人在动态环境中的动作同步性与安全性;多模态数据(如腕部与前方摄像头视频、关节状态)的时间对齐与高效存储要求精密的时间戳管理与压缩编码;此外,示范动作的质量一致性、任务场景的有限多样性(仅单一任务)以及数据规模的扩展性,均为后续模型训练与泛化能力评估带来了实质性制约。
常用场景
经典使用场景
在机器人操作领域,pick_green_block_into_box数据集为双臂机器人执行精细抓取与放置任务提供了典型范例。该数据集通过记录机器人手臂关节位置、夹爪状态以及多视角视觉信息,构建了从感知到动作的完整交互序列。研究者可借此训练模型学习如何协调双臂动作,实现将绿色积木精准放入箱中的目标,这为机器人灵巧操作研究奠定了数据基础。
解决学术问题
该数据集有效应对了机器人模仿学习与强化学习中样本效率低下、真实世界交互数据稀缺的挑战。通过提供包含状态、动作与视觉观测的高质量演示数据,它支持端到端策略学习、视觉运动控制等研究,促进了机器人从演示中泛化技能的能力。其结构化标注有助于探索多模态感知与动作生成的耦合机制,推动了机器人自主操作技术的理论进展。
实际应用
在工业自动化与物流分拣场景中,该数据集所代表的抓放任务具有直接应用价值。基于此类数据训练的模型可部署于装配线或仓库机器人,实现物体识别、抓取规划与放置操作的自动化。双臂协调能力尤其适用于处理不规则物体或需要精细操控的作业,提升了生产流程的灵活性与效率,为智能机器人系统的实际落地提供了技术支撑。
数据集最近研究
最新研究方向
在机器人操作领域,pick_green_block_into_box数据集作为LeRobot项目的一部分,聚焦于双臂协作的精细物体操控任务。该数据集整合了多视角视觉观测与关节状态数据,为模仿学习与强化学习算法提供了丰富的训练资源。当前研究前沿围绕多模态感知融合与端到端策略学习展开,旨在提升机器人在非结构化环境中的自适应抓取与放置能力。随着开源机器人社区的蓬勃发展,此类数据集正推动低成本、高效率的机器人技能泛化研究,为工业自动化和家庭服务机器人奠定关键技术基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作