eval_record-pick-and-place-so101_baseline

Hugging Face2025-11-21 更新2025-11-22 收录

下载链接：

https://huggingface.co/datasets/hbseong/eval_record-pick-and-place-so101_baseline

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人学任务的数据集，包含64个剧集，共计37470帧，专注于一个任务类型。数据集以Apache-2.0许可证发布，提供了包括动作、观测状态、顶部和右侧摄像头图像等丰富的特征信息。

This is a robotics task dataset consisting of 64 episodes and a total of 37,470 frames, focusing on a single task type. Released under the Apache-2.0 license, the dataset provides rich feature information including actions, observation states, top and right camera images, etc.

创建时间：

2025-11-21

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot

数据集结构

总任务数: 1
总回合数: 64
总帧数: 37470
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 500 MB
代码库版本: v3.0
机器人类型: so101_follower
块大小: 1000
分割: 训练集 (0:64)

数据文件路径

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征描述

动作特征

数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

顶部摄像头

数据类型: 视频
形状: [480, 640, 3]
视频信息:
- 高度: 480
- 宽度: 640
- 通道数: 3
- 帧率: 30
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: 否
- 音频: 无

右侧摄像头

数据类型: 视频
形状: [480, 640, 3]
视频信息:
- 高度: 480
- 宽度: 640
- 通道数: 3
- 帧率: 30
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: 否
- 音频: 无

索引特征

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
回合索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人操作领域，eval_record-pick-and-place-so101_baseline数据集依托LeRobot平台构建，通过so101_follower型机器人执行拾取与放置任务采集数据。该数据集包含64个完整任务片段，总计37470帧记录，以30帧每秒的速率捕获多模态信息。数据以分块形式存储于Parquet文件中，每块容量为1000帧，确保高效处理大规模时序数据，同时视频流采用AV1编码保存，为机器人学习提供结构化基准。

使用方法

研究人员可通过加载Parquet数据文件直接访问机器人状态序列与同步视频流，利用帧索引重建任务执行过程。数据集默认划分为训练集，涵盖全部64个任务片段，适用于端到端策略训练或行为克隆验证。视频数据可通过指定路径解码，结合动作指令与关节状态实现闭环仿真，为机器人操作任务的算法开发与性能评测提供标准化实验环境。

背景与挑战

背景概述

在机器人操作研究领域，抓取与放置任务作为基础性操作范式，长期受到学术界与工业界的共同关注。eval_record-pick-and-place-so101_baseline数据集由HuggingFace的LeRobot项目团队构建，采用Apache 2.0开源协议，专门面向SO101型跟随机器人平台。该数据集通过记录六自由度机械臂的关节位置、夹爪状态及多视角视觉观测数据，构建了包含64个完整任务序列的示范数据集，旨在为机器人模仿学习与策略评估提供标准化基准。其多模态数据融合架构体现了当前机器人学习研究中对感知-动作闭环建模的前沿探索。

当前挑战

该数据集针对机器人操作中的动作泛化难题，需解决从有限示范样本到未知场景的迁移挑战。构建过程中面临多传感器时序对齐的技术瓶颈，包括30Hz采样的视觉流与关节控制信号的高精度同步需求。数据存储方面需平衡高分辨率视频流与结构化动作参数的存储效率，采用分块Parquet格式处理总计600MB的多模态数据。此外，机械臂状态空间与图像观测的跨模态表征学习，以及动作指令在连续任务中的长期依赖性建模，均为亟待突破的核心技术难点。

常用场景

经典使用场景

在机器人操作学习领域，eval_record-pick-and-place-so101_baseline数据集以其结构化动作序列与多模态观测数据，为模仿学习与强化学习算法提供了标准验证平台。该数据集通过记录机械臂抓取任务中的关节位置、夹持器状态及双视角视觉信息，构建了完整的动作-状态交互轨迹，成为评估机器人策略泛化能力与动作精度的经典基准。

解决学术问题

该数据集有效解决了机器人操作任务中样本效率低下与策略迁移困难等核心学术问题。通过提供高精度时序对齐的多模态数据，研究者能够深入分析动作表征学习中的状态空间建模难题，推动端到端视觉运动策略的理论发展，为连续控制任务中的部分可观测马尔可夫决策过程研究提供关键数据支撑。

实际应用

在工业自动化场景中，该数据集支撑的算法已应用于精密装配与物流分拣系统。基于其构建的抓取策略模型能够适应不同光照条件下的视觉感知挑战，通过迁移学习技术将仿真环境训练的模型有效部署至实体机器人，显著提升了生产线中物体抓取任务的成功率和适应性。

数据集最近研究