pick_block_and_place
收藏Hugging Face2025-11-29 更新2025-11-30 收录
下载链接:
https://huggingface.co/datasets/HanDohyeon/pick_block_and_place
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于机器人任务的_dataset_数据集,包含了30个剧集,共11299帧。数据集由LeRobot创建,文件格式包括parquet和mp4。数据集特征包括机器人的动作、状态、顶部和手腕的图像信息,以及时间戳、帧索引等元数据。
创建时间:
2025-11-29
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 机器人技术
- 创建工具: LeRobot
数据集规模
- 总任务数: 1
- 总回合数: 30
- 总帧数: 11299
- 数据分块大小: 1000
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
- 帧率: 30 FPS
数据结构
- 数据格式: Parquet文件
- 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
- 视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
- 训练集划分: 0:30
特征描述
动作特征
- 数据类型: float32
- 维度: [6]
- 关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测特征
状态观测
- 数据类型: float32
- 维度: [6]
- 关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
图像观测
顶部摄像头:
- 数据类型: 视频
- 分辨率: 480×640×3
- 编码格式: AV1
- 像素格式: yuv420p
- 非深度图
腕部摄像头:
- 数据类型: 视频
- 分辨率: 480×640×3
- 编码格式: AV1
- 像素格式: yuv420p
- 非深度图
元数据特征
- 时间戳: float32[1]
- 帧索引: int64[1]
- 回合索引: int64[1]
- 索引: int64[1]
- 任务索引: int64[1]
技术信息
- 代码库版本: v3.0
- 机器人类型: so101_follower
搜集汇总
数据集介绍

构建方式
在机器人操作任务研究领域,pick_block_and_place数据集通过LeRobot平台系统构建。该数据集采集自so101_follower型机器人的实际交互过程,涵盖30个完整操作片段,总计11299帧数据。数据以分块形式存储于Parquet格式文件中,每块容量为1000帧,同时配套保存了多视角视频流,帧率为30fps,确保了动作序列与视觉观测的时空对齐。
使用方法
研究者可通过解析Parquet数据文件获取结构化观测与动作序列,配合MP4格式视频文件进行多模态分析。数据集已预设训练集划分,支持直接加载用于行为克隆或动态建模任务。利用特征字典中明确的维度定义与数据类型,可便捷提取关节角度、图像帧及时间序列元数据,适用于端到端策略学习、感知-动作关联分析等机器人智能研究场景。
背景与挑战
背景概述
机器人操作任务数据集作为强化学习研究的重要载体,近年来受到学术界广泛关注。pick_block_and_place数据集基于LeRobot开源框架构建,采用so101_follower型机器人采集操作数据,包含30个完整任务序列与11299帧多模态观测记录。该数据集通过整合关节角度控制信号与双视角视觉信息,为机器人抓取放置任务提供了标准化评估基准,其结构化特征设计显著推动了端到端机器人策略学习的发展。
当前挑战
在机器人操作领域,动态环境下的精确抓取与稳定放置始终存在动作泛化难题。该数据集构建过程中面临多源传感器时序对齐的技术挑战,需确保机械臂关节编码器数据与双路视觉帧率的精确同步。此外,高维动作空间中的策略学习易受动作延迟与累积误差影响,而有限的任务场景规模也制约了模型在复杂环境下的迁移能力。
常用场景
经典使用场景
在机器人操作领域,pick_block_and_place数据集为机械臂抓取与放置任务提供了标准化实验平台。其包含的30个完整操作序列与多视角视觉数据,能够有效支撑机器人动作规划算法的训练与验证。通过整合关节位置控制指令与实时环境观测,该数据集成为评估机器人模仿学习性能的重要基准。
解决学术问题
该数据集通过结构化记录机械臂运动轨迹与环境交互数据,解决了机器人模仿学习中动作表征与状态感知的耦合难题。其提供的六自由度关节控制参数与双视角视觉流,为研究机器人动作泛化、状态估计偏差修正等关键问题提供了数据支撑,显著推进了机器人自主操作的理论研究进程。
实际应用
在工业自动化场景中,该数据集可直接应用于智能分拣系统的算法优化。通过解析机械臂抓取过程中的关节运动模式与视觉反馈关联,能够提升物流仓储领域物品搬运的精准度与效率。其多模态数据特性还可延伸至服务机器人领域,为复杂环境下的物体操纵任务提供技术参照。
数据集最近研究
最新研究方向
在机器人操作任务领域,pick_block_and_place数据集正推动模仿学习与多模态感知的融合研究。前沿工作聚焦于利用其包含的关节状态与双视角视觉数据,开发端到端策略网络以提升抓取放置任务的泛化能力。随着具身智能热潮兴起,该数据集支持从演示中学习复杂操作序列,为家庭服务与工业自动化场景提供关键基准。其结构化动作空间与高帧率视频流,正成为评估时空推理模型的重要资源,促进机器人从感知到执行的闭环控制突破。
以上内容由遇见数据集搜集并总结生成



