pick_block_and_place

Hugging Face2025-11-29 更新2025-11-30 收录

下载链接：

https://huggingface.co/datasets/HanDohyeon/pick_block_and_place

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人任务的_dataset_数据集，包含了30个剧集，共11299帧。数据集由LeRobot创建，文件格式包括parquet和mp4。数据集特征包括机器人的动作、状态、顶部和手腕的图像信息，以及时间戳、帧索引等元数据。

创建时间：

2025-11-29

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
创建工具: LeRobot

数据集规模

总任务数: 1
总回合数: 30
总帧数: 11299
数据分块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS

数据结构

数据格式: Parquet文件
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
训练集划分: 0:30

特征描述

动作特征

数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

顶部摄像头:

数据类型: 视频
分辨率: 480×640×3
编码格式: AV1
像素格式: yuv420p
非深度图

腕部摄像头:

数据类型: 视频
分辨率: 480×640×3
编码格式: AV1
像素格式: yuv420p
非深度图

元数据特征

时间戳: float32[1]
帧索引: int64[1]
回合索引: int64[1]
索引: int64[1]
任务索引: int64[1]

技术信息

代码库版本: v3.0
机器人类型: so101_follower

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，pick_block_and_place数据集通过LeRobot平台系统构建。该数据集采集自so101_follower型机器人的实际交互过程，涵盖30个完整操作片段，总计11299帧数据。数据以分块形式存储于Parquet格式文件中，每块容量为1000帧，同时配套保存了多视角视频流，帧率为30fps，确保了动作序列与视觉观测的时空对齐。

使用方法

研究者可通过解析Parquet数据文件获取结构化观测与动作序列，配合MP4格式视频文件进行多模态分析。数据集已预设训练集划分，支持直接加载用于行为克隆或动态建模任务。利用特征字典中明确的维度定义与数据类型，可便捷提取关节角度、图像帧及时间序列元数据，适用于端到端策略学习、感知-动作关联分析等机器人智能研究场景。

背景与挑战

背景概述

机器人操作任务数据集作为强化学习研究的重要载体，近年来受到学术界广泛关注。pick_block_and_place数据集基于LeRobot开源框架构建，采用so101_follower型机器人采集操作数据，包含30个完整任务序列与11299帧多模态观测记录。该数据集通过整合关节角度控制信号与双视角视觉信息，为机器人抓取放置任务提供了标准化评估基准，其结构化特征设计显著推动了端到端机器人策略学习的发展。

当前挑战

在机器人操作领域，动态环境下的精确抓取与稳定放置始终存在动作泛化难题。该数据集构建过程中面临多源传感器时序对齐的技术挑战，需确保机械臂关节编码器数据与双路视觉帧率的精确同步。此外，高维动作空间中的策略学习易受动作延迟与累积误差影响，而有限的任务场景规模也制约了模型在复杂环境下的迁移能力。

常用场景

经典使用场景

在机器人操作领域，pick_block_and_place数据集为机械臂抓取与放置任务提供了标准化实验平台。其包含的30个完整操作序列与多视角视觉数据，能够有效支撑机器人动作规划算法的训练与验证。通过整合关节位置控制指令与实时环境观测，该数据集成为评估机器人模仿学习性能的重要基准。

解决学术问题

该数据集通过结构化记录机械臂运动轨迹与环境交互数据，解决了机器人模仿学习中动作表征与状态感知的耦合难题。其提供的六自由度关节控制参数与双视角视觉流，为研究机器人动作泛化、状态估计偏差修正等关键问题提供了数据支撑，显著推进了机器人自主操作的理论研究进程。

实际应用

在工业自动化场景中，该数据集可直接应用于智能分拣系统的算法优化。通过解析机械臂抓取过程中的关节运动模式与视觉反馈关联，能够提升物流仓储领域物品搬运的精准度与效率。其多模态数据特性还可延伸至服务机器人领域，为复杂环境下的物体操纵任务提供技术参照。

数据集最近研究