five

pick_block_and_place

收藏
Hugging Face2025-11-29 更新2025-11-30 收录
下载链接:
https://huggingface.co/datasets/HanDohyeon/pick_block_and_place
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于机器人任务的_dataset_数据集,包含了30个剧集,共11299帧。数据集由LeRobot创建,文件格式包括parquet和mp4。数据集特征包括机器人的动作、状态、顶部和手腕的图像信息,以及时间戳、帧索引等元数据。
创建时间:
2025-11-29
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 创建工具: LeRobot

数据集规模

  • 总任务数: 1
  • 总回合数: 30
  • 总帧数: 11299
  • 数据分块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 30 FPS

数据结构

  • 数据格式: Parquet文件
  • 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 训练集划分: 0:30

特征描述

动作特征

  • 数据类型: float32
  • 维度: [6]
  • 关节名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测特征

状态观测

  • 数据类型: float32
  • 维度: [6]
  • 关节名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

图像观测

顶部摄像头:

  • 数据类型: 视频
  • 分辨率: 480×640×3
  • 编码格式: AV1
  • 像素格式: yuv420p
  • 非深度图

腕部摄像头:

  • 数据类型: 视频
  • 分辨率: 480×640×3
  • 编码格式: AV1
  • 像素格式: yuv420p
  • 非深度图

元数据特征

  • 时间戳: float32[1]
  • 帧索引: int64[1]
  • 回合索引: int64[1]
  • 索引: int64[1]
  • 任务索引: int64[1]

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so101_follower
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作任务研究领域,pick_block_and_place数据集通过LeRobot平台系统构建。该数据集采集自so101_follower型机器人的实际交互过程,涵盖30个完整操作片段,总计11299帧数据。数据以分块形式存储于Parquet格式文件中,每块容量为1000帧,同时配套保存了多视角视频流,帧率为30fps,确保了动作序列与视觉观测的时空对齐。
使用方法
研究者可通过解析Parquet数据文件获取结构化观测与动作序列,配合MP4格式视频文件进行多模态分析。数据集已预设训练集划分,支持直接加载用于行为克隆或动态建模任务。利用特征字典中明确的维度定义与数据类型,可便捷提取关节角度、图像帧及时间序列元数据,适用于端到端策略学习、感知-动作关联分析等机器人智能研究场景。
背景与挑战
背景概述
机器人操作任务数据集作为强化学习研究的重要载体,近年来受到学术界广泛关注。pick_block_and_place数据集基于LeRobot开源框架构建,采用so101_follower型机器人采集操作数据,包含30个完整任务序列与11299帧多模态观测记录。该数据集通过整合关节角度控制信号与双视角视觉信息,为机器人抓取放置任务提供了标准化评估基准,其结构化特征设计显著推动了端到端机器人策略学习的发展。
当前挑战
在机器人操作领域,动态环境下的精确抓取与稳定放置始终存在动作泛化难题。该数据集构建过程中面临多源传感器时序对齐的技术挑战,需确保机械臂关节编码器数据与双路视觉帧率的精确同步。此外,高维动作空间中的策略学习易受动作延迟与累积误差影响,而有限的任务场景规模也制约了模型在复杂环境下的迁移能力。
常用场景
经典使用场景
在机器人操作领域,pick_block_and_place数据集为机械臂抓取与放置任务提供了标准化实验平台。其包含的30个完整操作序列与多视角视觉数据,能够有效支撑机器人动作规划算法的训练与验证。通过整合关节位置控制指令与实时环境观测,该数据集成为评估机器人模仿学习性能的重要基准。
解决学术问题
该数据集通过结构化记录机械臂运动轨迹与环境交互数据,解决了机器人模仿学习中动作表征与状态感知的耦合难题。其提供的六自由度关节控制参数与双视角视觉流,为研究机器人动作泛化、状态估计偏差修正等关键问题提供了数据支撑,显著推进了机器人自主操作的理论研究进程。
实际应用
在工业自动化场景中,该数据集可直接应用于智能分拣系统的算法优化。通过解析机械臂抓取过程中的关节运动模式与视觉反馈关联,能够提升物流仓储领域物品搬运的精准度与效率。其多模态数据特性还可延伸至服务机器人领域,为复杂环境下的物体操纵任务提供技术参照。
数据集最近研究
最新研究方向
在机器人操作任务领域,pick_block_and_place数据集正推动模仿学习与多模态感知的融合研究。前沿工作聚焦于利用其包含的关节状态与双视角视觉数据,开发端到端策略网络以提升抓取放置任务的泛化能力。随着具身智能热潮兴起,该数据集支持从演示中学习复杂操作序列,为家庭服务与工业自动化场景提供关键基准。其结构化动作空间与高帧率视频流,正成为评估时空推理模型的重要资源,促进机器人从感知到执行的闭环控制突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作