so101-test

Hugging Face2025-08-30 更新2025-08-31 收录

下载链接：

https://huggingface.co/datasets/DGEs/so101-test

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot代码库创建的数据集，包含5个视频文件，每个视频包含不同数量的帧，总共4383帧。数据集专注于单个任务，并分为单个数据块。数据包括动作和状态的浮点数表示、前视视频图像、时间戳、帧索引等信息。该数据集适用于机器人学相关的研究和开发。

创建时间：

2025-08-29

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot, LeRobot_codebase_v2.1

数据集结构

总任务数: 1
总视频数: 5
总片段数: 5
总帧数: 4383
块数: 1
块大小: 1000
帧率: 30 FPS

数据格式

数据文件格式: Parquet
数据文件路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作特征

名称: action
数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态特征

名称: observation.state
数据类型: float32
形状: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测特征

名称: observation.images.front
数据类型: video
分辨率: 640×480×3
视频信息:
- 高度: 640
- 宽度: 480
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

其他特征

timestamp: float32类型，形状[1]
frame_index: int64类型，形状[1]
episode_index: int64类型，形状[1]
index: int64类型，形状[1]
task_index: int64类型，形状[1]

分割信息

训练集: 包含全部5个片段

技术信息

机器人类型: so101_follower
代码库版本: v2.1
创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so101-test数据集依托LeRobot框架构建，采用结构化数据采集策略。该数据集通过so101_follower机器人平台记录多模态交互数据，涵盖5个完整任务片段，总计4383帧图像与动作序列。数据以30fps的采样率同步采集关节位置、前端视觉观测及时间戳信息，并以分块Parquet格式高效存储，确保原始数据的完整性与时序一致性。

特点

该数据集的核心特征体现在其多维度的机器人交互数据表征。动作空间包含6自由度关节位置控制指令，观测空间则同步提供等效关节状态与640x480分辨率的前端RGB视频流。数据集严格遵循时序逻辑，每帧数据均附带时间戳、帧索引与任务上下文标识，支持端到端的模仿学习与行为克隆研究。其紧凑的存储结构和清晰的元数据规范为算法复现提供了坚实基础。

使用方法

研究者可通过LeRobot代码库v2.1版本直接加载数据集，利用标准化的Parquet解析接口提取多模态数据流。典型应用场景包括机器人动作预测模型训练、视觉-运动协同表征学习，以及强化学习环境构建。数据划分明确指定全部5个片段用于训练，支持帧级或片段级批量加载，同时提供视频文件路径便于可视化验证。使用需遵循Apache-2.0许可协议。

背景与挑战

背景概述

机器人学习领域近年来在模仿学习与强化学习方面取得显著进展，so101-test数据集作为LeRobot代码库v2.1的重要组成部分，专注于机械臂控制任务的研究。该数据集由HuggingFace团队基于Apache-2.0开源协议构建，采用SO101型跟随机器人架构，包含5个完整任务序列共4383帧多模态数据。其核心价值在于提供了包含关节位置状态、前端视觉观测与时间戳信息的标准化数据格式，为机器人行为克隆与策略学习建立了高质量的基准测试环境。

当前挑战

该数据集主要应对机械臂精细操作中的高维连续动作空间建模挑战，需解决从视觉输入到关节角度控制的复杂映射问题。构建过程中面临多传感器时序同步精度保障、大规模视频数据压缩存储技术实现等工程难题，同时需确保6自由度机械臂运动轨迹在物理约束下的安全性与平滑性。深度估计与三维空间感知的缺失进一步增加了从二维图像推断动作策略的复杂度。

常用场景

经典使用场景

在机器人学习领域，so101-test数据集为模仿学习算法提供了标准化验证平台。该数据集通过记录六自由度机械臂的关节位置状态和前端视觉观测数据，构建了完整的动作-状态-观测映射关系。研究者可利用该数据集训练端到端的策略网络，使机器人能够通过视觉输入预测相应的关节控制指令，实现精准的任务执行。

实际应用

工业自动化场景中，该数据集支撑了视觉引导机械臂控制系统的开发。基于数据集训练的模型可应用于精密装配、物料分拣等实际任务，通过前端摄像头实时捕捉环境信息，生成精确的关节控制指令。这种应用模式大幅降低了机器人编程复杂度，提升了生产线适应动态环境的能力，为智能制造提供了关键技术支撑。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，包括基于时空注意力的视觉运动预测模型、多任务联合学习框架以及跨域策略迁移方法。研究者利用其丰富的多模态特性，开发了能够同时处理视觉输入和状态信息的混合架构，这些工作显著提升了机器人模仿学习的样本效率和泛化性能，形成了新的技术范式。

以上内容由遇见数据集搜集并总结生成