so100_pick3

Hugging Face2025-05-23 更新2025-05-24 收录

下载链接：

https://huggingface.co/datasets/love3165303/so100_pick3

下载链接

链接失效反馈

官方服务：

资源简介：

LeRobot数据集是一个机器人任务数据集，包含60个剧集，共计12299帧，专注于1个任务。数据集以Parquet格式存储，并提供对应的视频文件。数据集特征包括机器人的动作和状态，以及来自笔记本电脑和手机的图像。每个剧集被分为单个块，块大小为1000帧。

创建时间：

2025-05-15

原始信息汇总

数据集概述

基本信息

名称: so100_pick3
许可证: apache-2.0
任务类别: robotics
标签: LeRobot, so100, tutorial
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

配置名称: default
数据文件: data//.parquet
代码库版本: v2.1
机器人类型: so100
总集数: 60
总帧数: 12299
总任务数: 1
总视频数: 120
总块数: 1
块大小: 1000
帧率: 30 fps
分割:
- 训练集: 0:60
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

action:
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
observation.images.laptop:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 信息:
  - video.height: 480
  - video.width: 640
  - video.codec: av1
  - video.pix_fmt: yuv420p
  - video.is_depth_map: false
  - video.fps: 30
  - video.channels: 3
  - has_audio: false
observation.images.phone:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 信息:
  - video.height: 480
  - video.width: 640
  - video.codec: av1
  - video.pix_fmt: yuv420p
  - video.is_depth_map: false
  - video.fps: 30
  - video.channels: 3
  - has_audio: false
timestamp:
- 数据类型: float32
- 形状: [1]
frame_index:
- 数据类型: int64
- 形状: [1]
episode_index:
- 数据类型: int64
- 形状: [1]
index:
- 数据类型: int64
- 形状: [1]
task_index:
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so100_pick3数据集通过LeRobot平台系统性地采集了60个完整交互序列，涵盖12299帧数据。采用分块存储策略将数据组织为1000帧的块结构，每个交互序列以Parquet格式保存，确保高效的数据访问与存储管理。数据采集过程中同步记录了六自由度机械臂的关节控制指令与多视角视觉观测，构建了完整的机器人操作状态记录体系。

特点

该数据集的核心特征在于其多模态数据融合架构，同时包含机械臂的六维动作向量与对应的关节状态观测。视觉数据方面提供笔记本电脑与手机双视角的RGB视频流，分辨率统一为640×480像素，帧率稳定在30fps。数据结构采用严格的时空索引机制，通过时间戳、帧索引与交互序列索引实现精确的数据对齐，为机器人模仿学习研究提供高一致性的训练样本。

使用方法

研究人员可通过标准化的数据加载流程直接访问数据集，利用预定义的路径模板读取分块存储的Parquet文件。训练时可根据帧索引与交互序列索引提取对应的动作-观测对，其中动作空间涵盖肩部平移、肩部抬升、肘部弯曲等六个自由度控制参数。视觉数据支持直接解码为视频流，便于开发基于视觉的机器人控制策略，所有数据均适用于端到端的模仿学习算法训练。

背景与挑战

背景概述

在机器人学习领域，模仿学习作为实现智能体自主操作的重要范式，持续推动着机器人技术的革新。so100_pick3数据集由HuggingFace的LeRobot项目团队构建，专注于机械臂抓取任务的示范数据收集。该数据集通过记录斯坦福OmniRobot 100型机械臂的关节控制指令与多视角视觉观测，为研究端到端机器人策略学习提供了结构化实验数据。其包含60条完整操作轨迹与12299帧同步传感器数据，通过Apache 2.0协议开放共享，显著降低了机器人模仿学习研究的入门门槛。

当前挑战

机器人操作任务面临动作空间高维连续控制与视觉感知对齐的核心难题。so100_pick3需解决从异构传感器流中提取有效特征的问题，包括协调六自由度机械臂关节运动与双视角视觉信息的时空对应关系。在数据构建过程中，团队需克服多模态数据同步采集的技术障碍，确保30Hz采样频率下动作指令与图像帧的精确时序匹配。同时，原始视频数据的实时编码与存储优化也构成重要挑战，需在保证数据质量前提下控制存储开销。

常用场景

经典使用场景

在机器人学习领域，so100_pick3数据集作为LeRobot项目的重要组成部分，为模仿学习算法的开发提供了关键支持。该数据集通过记录机械臂执行拾取任务时的多模态观测数据，包括关节状态和双视角视觉信息，为研究者构建端到端策略网络创造了理想条件。其结构化存储的连续动作序列与同步图像流，使得模型能够学习从感知到控制的完整映射关系，成为机器人技能获取研究的基准平台。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，包括基于时空注意力的多视角融合网络架构和分层强化学习框架。研究者利用其丰富的动作-观测对开发了跨域策略迁移算法，显著提升了在未见场景下的泛化能力。近期工作还探索了结合语言指令的视觉运动控制模型，为具身智能系统的开放环境适应性问题提供了新的解决思路。

数据集最近研究