record-pick-and-place-pos5-so101

Hugging Face2025-11-28 更新2025-11-29 收录

下载链接：

https://huggingface.co/datasets/hbseong/record-pick-and-place-pos5-so101

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人的数据集，包含210个剧集，共计105357帧，专注于1个任务。数据集以Parquet文件格式存储，并配有相应的视频文件。数据集的特征包括机器人的动作和状态，以及顶部和右侧的图像。所有数据遵循apache-2.0许可证。

创建时间：

2025-11-27

原始信息汇总

数据集概述

基本信息

名称: record-pick-and-place-pos5-so101
许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot

数据集规模

总任务数: 1
总回合数: 210
总帧数: 105,357
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS

数据特征

动作特征

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测:
- 数据类型: float32
- 维度: [6]
- 关节位置: 与动作特征相同
图像观测:
- 顶部摄像头:
  - 分辨率: 480×640×3
  - 视频编码: av1
  - 像素格式: yuv420p
  - 非深度图
- 右侧摄像头:
  - 分辨率: 480×640×3
  - 视频编码: av1
  - 像素格式: yuv420p
  - 非深度图

元数据特征

时间戳: float32 [1]
帧索引: int64 [1]
回合索引: int64 [1]
索引: int64 [1]
任务索引: int64 [1]

数据格式

数据文件: Parquet格式
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
分块大小: 1000

分割信息

训练集: 全部210个回合

技术信息

代码库版本: v3.0
机器人类型: so101_follower
创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，该数据集通过LeRobot平台系统性地采集了210个完整操作序列，涵盖拾取与放置任务的全过程。数据以30帧/秒的速率记录，包含105,357帧结构化数据，采用分块存储机制将信息组织为1000帧单位的Parquet文件，确保高效存取与处理。每个数据块整合了机器人关节状态、多视角视觉观测及时间戳元数据，形成完整的时空轨迹记录。

特点

该数据集显著特征在于多模态数据的深度融合，同时提供六自由度机械臂的关节位置控制指令与对应的本体状态反馈。视觉感知模块配备双视角RGB摄像头，分别从顶部与侧方位捕捉480×640分辨率的操作场景，为行为克隆研究提供丰富的环境上下文。数据维度设计遵循机器人学习范式，包含帧索引、任务编号等结构化元数据，支持长时序行为分析与跨任务泛化研究。

使用方法

研究者可通过标准数据加载接口直接读取Parquet格式的存储文件，利用帧索引与情景编号实现精确的数据切片。训练过程中可提取关节空间动作指令与多视角图像观测构建端到端策略网络，时序对齐机制确保状态-动作对的连续性。该数据集兼容主流强化学习框架，支持从视觉感知到关节控制的完整管道验证，为模仿学习与行为克隆算法提供基准测试平台。

背景与挑战

背景概述

机器人操作任务数据集作为强化学习与模仿学习研究的重要基础资源，record-pick-and-place-pos5-so101数据集由HuggingFace团队通过LeRobot平台构建，聚焦于机械臂抓取与放置这一经典机器人控制问题。该数据集收录了210条完整操作序列与超过十万帧多模态数据，通过双视角视觉观测与六自由度关节控制信号，为研究高维状态空间下的动作策略生成提供了结构化实验环境。其采用Apache 2.0开源协议促进学术共享，通过标准化数据格式推动机器人学习算法的可复现性研究。

当前挑战

在机器人操作领域，该数据集致力于解决非结构化环境中物体抓取位姿估计与运动轨迹规划的复合难题。构建过程中面临多传感器时序对齐的技术挑战，需确保30Hz采集频率下机械臂关节编码器数据与双路视觉流间的严格同步。数据标注维度涵盖六维连续动作空间与480p分辨率图像流，对存储架构与传输带宽提出较高要求。此外，真实物理系统存在的执行器延迟与视觉遮挡现象，进一步增加了高质量示范数据采集的复杂度。

常用场景

经典使用场景

在机器人操作领域，该数据集专为拾取与放置任务设计，通过记录六自由度机械臂的关节位置与视觉观测数据，为强化学习算法提供丰富的训练样本。其多视角视频流与精确的动作标注，使研究者能够构建端到端的控制策略，模拟真实环境中的物体抓取过程。

解决学术问题

该数据集有效解决了机器人模仿学习中样本效率低下的核心难题，通过高精度时序动作序列与多模态观测数据，为策略泛化与状态表示学习提供基准。其标准化数据格式显著降低了机器人感知与控制联合建模的复杂度，推动了具身智能在结构化环境中的研究进展。

衍生相关工作

基于该数据集衍生的研究已催生多项经典工作，包括基于时空注意力的操作策略网络、多传感器融合的抓取成功率预测模型等。这些成果通过挖掘数据集中隐藏的时序依赖关系，进一步推动了机器人操作技能的可迁移性与自适应能力研究。

以上内容由遇见数据集搜集并总结生成