so101-sim-rock-a-stack-hard-degrees

Hugging Face2025-10-31 更新2025-11-01 收录

下载链接：

https://huggingface.co/datasets/liorbenhorin-nv/so101-sim-rock-a-stack-hard-degrees

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个与机器人学相关的数据集，使用LeRobot创建。数据集包含机器人类型、总剧集数、总帧数和任务数等信息。数据集的结构详细描述了数据文件和视频文件的路径、特征类型（包括观察、图像、动作等）以及帧索引和集索引等元数据。

创建时间：

2025-10-27

原始信息汇总

数据集概述

基本信息

名称: so101-sim-rock-a-stack-hard-degrees
任务类别: 机器人学
标签: LeRobot, robotics, teleop, rock-a-stack
许可证: Apache-2.0

数据集规模

总任务数: 1
总回合数: 86
总帧数: 34977
帧率: 30 fps
数据文件大小: 100 MB
视频文件大小: 500 MB

数据结构

数据格式: Parquet文件
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
分块大小: 1000
训练集: 全部86个回合

特征说明

观测特征

observation.state:
- 数据类型: float32
- 形状: [6]
- 关节位置: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.images.ego:
- 数据类型: 视频
- 分辨率: 480×640×3
- 视频编码: AV1
- 像素格式: yuv420p
observation.images.external:
- 数据类型: 视频
- 分辨率: 480×640×3
- 视频编码: AV1
- 像素格式: yuv420p

动作特征

action:
- 数据类型: float32
- 形状: [6]
- 关节位置: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

元数据特征

timestamp: 时间戳 (float32)
frame_index: 帧索引 (int64)
episode_index: 回合索引 (int64)
index: 索引 (int64)
task_index: 任务索引 (int64)

技术信息

机器人类型: so101_follower
代码库版本: v3.0
创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人操作研究领域，so101-sim-rock-a-stack-hard-degrees数据集通过LeRobot框架实现了系统性构建。该数据集采用SO101型机器人仿真平台，以堆叠环状物体的任务为核心场景，通过遥操作方式采集了86个完整交互序列。数据以30帧/秒的采样频率记录机器人关节状态与双视角视觉信息，最终以分块Parquet格式存储，总数据量达600MB，形成了兼具时序连续性与空间多模态特性的机器人操作数据集。

特点

该数据集在机器人学习领域展现出显著的多模态特性，其观测空间包含六维关节角度状态与双路480×640分辨率彩色视频流。动作空间采用与观测状态维度匹配的六自由度控制指令，确保了策略学习的直接映射关系。数据集涵盖34977个时序帧，每个片段包含完整的任务执行轨迹，并通过统一的时空索引机制实现高效检索。这种结构设计既保留了操作任务的动态连续性，又为模仿学习与强化学习算法提供了丰富的状态-动作对应关系。

使用方法

研究人员可通过LeRobot生态系统直接加载该数据集进行机器人策略学习。数据按1000帧为单位分块存储，支持流式加载与随机存取。训练时可同步获取关节状态观测与双视角视觉输入，动作标签可直接用于监督学习或行为克隆。数据集已预划分为训练集，使用者可基于帧索引或片段索引构建训练批次，其标准化的数据接口确保与主流机器人学习框架的兼容性，为复杂操作任务的策略验证提供可靠基准。

背景与挑战

背景概述

机器人操作任务数据集so101-sim-rock-a-stack-hard-degrees由LeRobot研究团队基于Apache 2.0协议构建，聚焦于复杂环境下的堆叠操作任务。该数据集通过模拟SO101型机器人执行堆叠动作，记录了包含6自由度关节状态、双视角视觉数据及对应动作指令的多模态交互序列，其86个完整任务片段与34977帧数据为机器人精细操作研究提供了结构化基准。作为机器人学习领域的重要资源，该数据集通过高精度时序同步与多传感器融合机制，显著推进了从感知到动作的端到端策略学习研究进程。

当前挑战

该数据集致力于解决机器人精细操作中堆叠任务的高维度动作规划难题，其挑战体现在多关节协同控制的动态稳定性与视觉-动作映射的精确性要求。构建过程中面临传感器时序对齐的复杂性，需确保30Hz采样频率下六维关节数据与双路视频流的严格同步；同时受限于物理模拟环境，数据多样性受到任务场景单一性与动作轨迹复杂度的双重制约，亟需通过增量采集提升策略泛化能力。

常用场景

经典使用场景

在机器人操作学习领域，该数据集聚焦于堆叠环任务，通过记录机械臂关节状态与多视角视觉数据，为模仿学习算法提供真实交互轨迹。研究人员可基于86个完整操作序列，构建从视觉感知到动作执行的端到端映射模型，特别适用于分析复杂抓取姿态与精细操作策略的对应关系。

实际应用

在工业自动化场景中，该数据集支撑了装配线环状零件堆叠系统的开发，通过迁移学习可将训练模型部署至实际机械臂控制。其多模态特性尤其适用于需要视觉反馈的精密装配任务，为柔性制造系统中自适应抓取策略的落地提供了关键数据支撑。

衍生相关工作

基于该数据集的特性，已衍生出多项机器人技能迁移研究，例如结合元学习框架的跨任务泛化方法，以及利用时空注意力机制的动态动作分割算法。这些工作通过挖掘数据集中连续操作序列的潜在模式，进一步推动了分层强化学习在复杂操作任务中的应用边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集