pen_pickup_dataset_sreak

Hugging Face2025-09-03 更新2025-09-04 收录

下载链接：

https://huggingface.co/datasets/sreak1089/pen_pickup_dataset_sreak

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人学任务的数据集，包含了与LeRobot项目相关的动作和观察数据。数据集由2个剧集、3590帧图像组成，共包含1个任务和4个视频文件。数据以Parquet格式存储，并提供了对应的视频文件。每个剧集被分为一个数据块，每个数据块包含1000帧。数据集支持的特征包括动作的位置信息、观察状态、正面和手腕的图像数据等。

创建时间：

2025-09-01

原始信息汇总

数据集概述

基本信息

名称: pen_pickup_dataset_sreak
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总任务数: 1
总片段数: 2
总帧数: 3590
总视频数: 4
数据块数: 1
数据块大小: 1000
帧率: 30 FPS
分割: 训练集包含全部2个片段

数据格式

数据文件路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作特征

名称: action
数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

名称: observation.state
数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

前视图像观测

名称: observation.images.front
数据类型: video
图像尺寸: 480×640×3
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30
- 通道数: 3
- 无音频

腕部图像观测

名称: observation.images.wrist
数据类型: video
图像尺寸: 480×640×3
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30
- 通道数: 3
- 无音频

元数据特征

时间戳: float32, 形状[1]
帧索引: int64, 形状[1]
片段索引: int64, 形状[1]
索引: int64, 形状[1]
任务索引: int64, 形状[1]

技术信息

代码库版本: v2.1
机器人类型: so101_follower
创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人操作任务的数据采集领域，pen_pickup_dataset_sreak依托LeRobot平台构建，采用实际机械臂执行拾取笔的任务。数据集通过SO101型机器人记录了两个完整操作序列，以30帧每秒的速率采集了3590帧数据，涵盖关节位置、前端及腕部视觉信息，并以分块Parquet格式高效存储，确保数据结构的完整性与可扩展性。

特点

该数据集突出多维异构数据融合，包含六维关节动作状态、双视角RGB视频流及时间序列索引。视频数据采用AV1编码，分辨率为640x480，兼具轻量化与高保真特性；动作与状态数据以浮点精度记录，支持精细的动力学分析。其设计兼顾实时控制与离线研究需求，为模仿学习与视觉伺服提供丰富上下文。

使用方法

研究者可通过加载Parquet文件直接访问时序对齐的多模态数据，其中动作向量与观测状态可用于行为克隆模型训练，双路视频流支持视觉表征学习。数据集已预设训练集划分，兼容主流机器人学习框架，用户可依据帧索引重建操作轨迹，或提取特定片段进行闭环控制验证。

背景与挑战

背景概述

机器人操作任务数据集作为强化学习与模仿学习研究的重要基础，pen_pickup_dataset_sreak由HuggingFace的LeRobot团队基于so101_follower机器人平台构建，专注于机械臂抓取操作任务的动态行为记录。该数据集通过多模态传感器同步采集关节状态、视觉观测与动作指令数据，为机器人精细操作策略的端到端学习提供了高质量示范样本。其采用Apache 2.0开源协议发布，体现了现代机器人学习数据共享的标准化趋势。

当前挑战

该数据集核心挑战在于解决高自由度机械臂的精细操作问题，需协调多关节运动与视觉反馈以实现稳定抓取。构建过程中面临多传感器时序同步、大规模视频数据压缩存储等技术难点，同时需保证动作轨迹的平滑性与任务成功率。此外，有限的任务场景覆盖与样本规模对泛化能力提出更高要求。

常用场景

经典使用场景

在机器人操作学习领域，pen_pickup_dataset_sreak数据集通过记录六自由度机械臂拾取笔具的完整运动轨迹，为模仿学习算法提供了标准化的训练与验证平台。其多模态数据融合了关节角度状态与双视角视觉信息，能够有效支撑端到端策略网络的训练过程，成为机器人精细操作任务研究的基准数据集之一。

实际应用

工业自动化中的精密装配环节可借助该数据集训练的模型实现物体抓取定位优化。服务机器人领域则通过迁移学习将其应用于餐具整理、药品分拣等日常操作任务，其双视角视觉架构特别适用于需要避障与精细操作的场景，显著提升机器人对细小物体的操作成功率。

衍生相关工作

基于该数据集衍生了多智能体协同抓取框架与跨模态预训练模型等创新研究。部分工作通过提取其时空特征构建了行为克隆算法的增强版本，另有研究利用其多视角视频数据开发了视觉运动表征学习系统，这些成果持续推动着机器人操作技能迁移技术的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集