so101_30_1

Hugging Face2025-05-22 更新2025-05-23 收录

下载链接：

https://huggingface.co/datasets/Rorschach4153/so101_30_1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，用于机器人学领域。它包含了1个总剧集，894个总帧数，1个总任务和3个总视频。数据集以parquet格式存储，并且包含有关机器人动作和观察状态的特征，如肩膀、肘部、手腕的位置和抓取器的状态。此外，还包括侧视图、手腕视图和俯视图的视频数据。数据集的许可为apache-2.0。

创建时间：

2025-05-22

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot, so101, tutorial
数据集主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

数据文件格式: parquet
数据文件路径: data//.parquet
代码库版本: v2.1
机器人类型: so101
总集数: 1
总帧数: 894
总任务数: 1
总视频数: 3
总块数: 1
块大小: 1000
帧率: 30 fps
数据分割: train (0:1)

特征描述

action:
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
observation.images.side:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息: height=480, width=640, codec=av1, pix_fmt=yuv420p, is_depth_map=false, fps=30, channels=3, has_audio=false
observation.images.wrist:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息: height=480, width=640, codec=av1, pix_fmt=yuv420p, is_depth_map=false, fps=30, channels=3, has_audio=false
observation.images.topdown:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息: height=480, width=640, codec=av1, pix_fmt=yuv420p, is_depth_map=false, fps=30, channels=3, has_audio=false
timestamp:
- 数据类型: float32
- 形状: [1]
frame_index:
- 数据类型: int64
- 形状: [1]
episode_index:
- 数据类型: int64
- 形状: [1]
index:
- 数据类型: int64
- 形状: [1]
task_index:
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so101_30_1数据集依托LeRobot开源框架构建而成，采用结构化数据采集方式记录机械臂操作过程。该数据集通过分段存储机制将894帧操作数据划分为单个数据块，以30fps的采样频率同步记录六自由度机械臂的关节控制指令与多视角视觉信息。数据以标准化parquet格式存储，确保高效读取与跨平台兼容性，每条记录均包含精确的时间戳和帧索引，为机器人模仿学习研究提供完整的数据支撑。

特点

该数据集最显著的特征在于其多模态数据融合能力，同时囊括机械臂的六维动作控制信号与三路高清视觉流。动作空间完整覆盖肩部平移、肩部抬升、肘部弯曲、腕部屈伸、腕部旋转及夹持器开合等核心自由度，视觉数据则通过侧视、腕戴和俯视三个视角以480×640分辨率立体呈现操作场景。所有视频流均采用AV1编码技术，在保证视觉质量的同时显著降低存储需求，这种多维度的数据表征为复杂操作任务的算法建模创造了理想条件。

使用方法

研究人员可通过HuggingFace平台直接加载该数据集进行机器人行为克隆与强化学习算法开发。数据集采用标准化的特征字典结构，用户可通过指定数据路径调用训练集片段，其中动作指令、关节状态观测与多路视频流均已完成时空对齐。在具体应用中，开发者可提取六维连续动作空间数据作为监督信号，同时利用三视角图像序列构建视觉感知模块，帧索引与时间戳信息则为时序建模提供关键支撑，最终实现端到端的机器人操作策略学习。

背景与挑战

背景概述

机器人操作数据集作为强化学习与模仿学习研究的重要基础资源，其发展历程始终与机器人智能控制技术的演进紧密相连。so101_30_1数据集由HuggingFace团队通过LeRobot开源框架构建，专门面向六自由度机械臂的操作任务研究。该数据集通过多视角视觉感知系统（侧视、腕部与俯视摄像头）与六维关节动作空间的同步记录，为机器人动作策略学习提供了包含894帧连续操作序列的标准化数据支撑，其30Hz采样频率与标准化数据格式显著提升了机器人学习任务的实验复现性。

当前挑战

在机器人操作领域，该数据集需应对高维连续动作空间与多模态感知融合的核心难题，其六自由度机械臂的精确控制要求算法具备对非线性动力学特性的建模能力。数据构建过程中面临多传感器时序对齐的技术挑战，三路视觉数据与关节状态数据的毫秒级同步需克服硬件触发延迟与数据流缓冲的复杂性。此外，有限的任务多样性（仅含单一任务场景）与数据规模制约了泛化能力的验证，而原始数据中缺失论文引用与创建背景信息则对学术溯源造成障碍。

常用场景

经典使用场景

在机器人学习领域，so101_30_1数据集作为LeRobot项目的重要组成部分，主要用于机器人行为模仿与强化学习算法的训练与验证。该数据集通过多视角视觉观测与六自由度机械臂动作记录，为研究者提供了丰富的机器人操作序列数据，典型应用于端到端策略学习模型的开发，帮助算法理解从感知到执行的完整决策流程。

实际应用

在工业自动化场景中，该数据集支撑了机械臂精细操作任务的算法研发，如精密装配、物料分拣等实际应用。通过融合腕部、侧视与俯视三路视觉信息，系统能够构建更鲁棒的环境感知能力，为柔性制造生产线中的自适应控制策略提供了可靠的数据支撑。

衍生相关工作

基于该数据集的特性，衍生出多项机器人视觉运动控制领域的创新研究。这些工作重点探索了多视角时空特征融合、分层强化学习架构设计等方向，部分成果已拓展至动态环境下的抓取规划、多任务协同操作等复杂场景，持续推动着机器人操作智能的技术演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集