LerobotBlockPickerV1
收藏Hugging Face2025-10-24 更新2025-10-25 收录
下载链接:
https://huggingface.co/datasets/wvangils/LerobotBlockPickerV1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集与机器人学相关,包含特定机器人类型(so101_follower)的操作视频和相关状态数据。数据集共有10个剧集,3974帧,20个视频,分为1个块,每个块大小为1000。数据集的结构包括动作状态、观察状态、顶部和手腕视角的图像以及其他时间戳和索引元数据。数据集根据Apache-2.0许可证授权。
创建时间:
2025-10-17
原始信息汇总
LerobotBlockPickerV1 数据集概述
基本信息
- 数据集名称: LerobotBlockPickerV1
- 许可证: Apache-2.0
- 任务类别: 机器人技术
- 标签: LeRobot
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
数据集规模
- 总情节数: 10
- 总帧数: 3974
- 总任务数: 1
- 总视频数: 20
- 数据块数: 1
- 数据块大小: 1000
- 帧率: 30 FPS
- 数据分割: 训练集 (0:10)
数据结构
数据文件路径
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征字段
动作特征
- 名称: action
- 数据类型: float32
- 维度: [6]
- 关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测特征
状态观测:
- 名称: observation.state
- 数据类型: float32
- 维度: [6]
- 关节名称: 与动作特征相同
图像观测: 顶部摄像头:
- 名称: observation.images.top
- 数据类型: video
- 分辨率: 240×320×3
- 视频编码: av1
- 像素格式: yuv420p
- 非深度图: false
- 音频: 无
腕部摄像头:
- 名称: observation.images.wrist
- 数据类型: video
- 分辨率: 240×320×3
- 视频编码: av1
- 像素格式: yuv420p
- 非深度图: false
- 音频: 无
索引特征
- 时间戳: float32 [1]
- 帧索引: int64 [1]
- 情节索引: int64 [1]
- 索引: int64 [1]
- 任务索引: int64 [1]
技术信息
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 数据格式: Parquet
搜集汇总
数据集介绍

构建方式
在机器人技术领域,LerobotBlockPickerV1数据集通过LeRobot框架系统性地采集了真实环境下的机械臂操作数据。该数据集包含10个完整任务片段,总计3974帧数据,以30帧每秒的速率记录。数据以分块形式存储于Parquet文件中,每个块包含1000个数据点,确保了高效的数据管理与访问。采集过程涉及so101_follower型机器人,其关节状态与视觉信息被同步捕获,为机器人学习研究提供了可靠的实验基础。
特点
该数据集在机器人操作任务中展现出多模态特性,融合了六维关节动作指令与双视角视觉观测。动作空间涵盖肩部平移、肩部抬升、肘部弯曲、腕部屈伸、腕部旋转及夹爪位置六个自由度,状态观测则提供对应的关节反馈。视觉数据包含顶部与腕部摄像头采集的240x320分辨率RGB视频,采用AV1编码压缩,确保了数据质量与存储效率的平衡。时间戳与帧索引的精确记录为时序分析提供了支持,整体结构设计便于机器人控制算法的训练与验证。
使用方法
研究人员可通过加载Parquet格式的数据文件直接访问数据集内容,其中训练集涵盖全部10个任务片段。数据特征包含动作向量、关节状态观测、双视角图像流及元数据索引,支持端到端的机器人策略学习。视频数据以MP4格式独立存储,可与状态数据同步解析。该数据集兼容主流的机器学习框架,用户可依据帧索引重建完整任务序列,适用于模仿学习、强化学习等机器人算法开发场景。
背景与挑战
背景概述
LerobotBlockPickerV1数据集作为机器人操作领域的重要数据资源,由HuggingFace的LeRobot项目团队基于开源机器人学习框架构建。该数据集聚焦于多视角视觉感知与机械臂控制策略的协同学习,通过记录六自由度机械臂的关节位置状态与双视角视觉数据,为模仿学习与强化学习算法提供真实世界的交互轨迹。其结构化存储的3974帧操作序列涵盖10个完整任务片段,以30Hz同步采集的顶部与腕部视角视频形成了时空对齐的多模态观测体系,显著推进了机器人精细操作任务的端到端学习研究进程。
当前挑战
在机器人操作任务领域,该数据集需解决高维连续动作空间与视觉观测对齐的泛化性问题,其六维关节控制与双视角图像融合要求模型具备跨模态时序推理能力。数据构建过程中面临多传感器时序同步的技术瓶颈,需确保机械臂状态数据与240×320分辨率视频帧的毫秒级精准匹配。此外,受限的10个任务片段与单一操作场景导致数据多样性不足,难以覆盖现实环境中物体位姿变化与光照干扰等复杂因素,对算法的鲁棒性提出更高要求。
常用场景
经典使用场景
在机器人操作学习领域,LerobotBlockPickerV1数据集通过记录六自由度机械臂的关节位置与多视角视觉数据,为模仿学习算法提供了标准化的训练资源。其包含的顶部与腕部摄像头视频流与同步动作指令,能够有效支持端到端策略网络的训练过程,尤其在物体抓取等精细操作任务中展现出重要价值。
实际应用
在工业自动化场景中,该数据集可直接用于训练智能分拣系统的控制模块,通过迁移学习策略适应不同形状物体的抓取任务。其记录的关节运动轨迹与视觉反馈机制,为开发自适应抓取算法提供了关键数据支撑,显著降低了机器人编程的门槛,促进了柔性制造系统的智能化升级。
衍生相关工作
基于该数据集的特性,研究社区衍生出多项创新工作,包括结合时空注意力的行为克隆模型、多视角视觉特征融合网络以及基于元学习的快速适应算法。这些研究不仅拓展了数据集的利用维度,更推动了机器人学习领域在跨任务泛化与少样本学习方面的理论突破。
以上内容由遇见数据集搜集并总结生成



