so101_grab_the_screw_big

Hugging Face2025-10-24 更新2025-10-25 收录

下载链接：

https://huggingface.co/datasets/peterrolfes/so101_grab_the_screw_big

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个与机器人学相关的数据集，包含了一种特定类型机器人的行为和任务数据。数据以Parquet文件格式存储，并包括视频文件。数据集的特征包括机器人各部位的动作和位置信息，以及从不同视角获取的图像和时间戳。该数据集遵循Apache-2.0许可证。

创建时间：

2025-10-21

原始信息汇总

数据集概述

基本信息

数据集名称: so101_grab_the_screw_big
任务类别: 机器人技术
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot

数据集规模

总任务数: 1
总情节数: 70
总帧数: 29141
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
数据块大小: 1000

数据结构

数据特征

动作特征:
- 数据类型: float32
- 维度: [6]
- 关节位置: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态:
- 数据类型: float32
- 维度: [6]
- 关节位置: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
顶部图像观测:
- 数据类型: 视频
- 分辨率: 720×1280×3
- 视频编码: AV1
- 像素格式: yuv420p
- 非深度图
前部图像观测:
- 数据类型: 视频
- 分辨率: 1080×1920×3
- 视频编码: AV1
- 像素格式: yuv420p
- 非深度图

元数据特征

时间戳: float32[1]
帧索引: int64[1]
情节索引: int64[1]
索引: int64[1]
任务索引: int64[1]

数据组织

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据分割: 训练集包含所有70个情节

技术信息

代码库版本: v3.0
机器人类型: so101_follower
音频: 无

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，so101_grab_the_screw_big数据集通过LeRobot平台系统采集了70个完整操作序列，涵盖29141帧时序数据。该数据集采用分块存储架构，将动作轨迹与多视角视觉观测数据按千帧单元封装于Parquet格式文件中，辅以同步记录的30fps高清视频流，构建起机器人关节空间与视觉感知的时空对齐映射关系。

特点

该数据集显著特征体现在多模态数据融合与精细动作标注层面，其包含六自由度机械臂的关节位置控制指令及对应状态反馈，同时集成顶视与前置双视角RGB视频流，分别以1280×720与1920×1080分辨率完整记录操作场景。数据结构采用分层索引机制，通过帧索引、回合索引与任务索引实现精确数据定位，为模仿学习与策略泛化研究提供丰富时空上下文。

使用方法

研究者可通过解析Parquet数据文件获取机器人动作指令与状态观测序列，结合对应MP4格式视频文件进行行为克隆或强化学习算法训练。数据集采用Apache 2.0开源协议，支持直接加载至主流机器学习框架进行端到端模型开发，其标准化的数据接口与分块存储设计尤其适合分布式训练环境下的流式数据读取与增量学习任务。

背景与挑战

背景概述

在机器人操作任务研究领域，so101_grab_the_screw_big数据集作为LeRobot项目的重要组成部分，聚焦于机械臂精细操作任务的实证数据采集。该数据集通过集成多视角视觉感知与关节运动控制，构建了包含70个完整操作序列、近三万帧数据的结构化资源，其核心研究目标在于解决机器人对特定工具（如螺丝）的精准抓取与操控问题。通过记录六自由度机械臂的关节位置轨迹与同步视觉观测，该数据集为模仿学习与策略泛化研究提供了关键实验基础，推动了机器人自主操作能力的边界拓展。

当前挑战

该数据集致力于应对机器人精细操作中动作轨迹优化与多模态感知融合的双重挑战，具体表现为机械臂在动态环境中对小型物体的稳定抓取精度不足，以及视觉-动作映射关系的建模复杂性。在构建过程中，数据采集面临传感器同步精度控制、多视角视频数据存储效率优化等工程难题，同时需保证操作序列在关节空间与任务空间中的时空一致性，这些因素共同构成了数据集质量提升与技术突破的关键瓶颈。

常用场景

经典使用场景

在机器人操作学习领域，so101_grab_the_screw_big数据集通过记录机械臂抓取螺丝的完整动作序列，为模仿学习算法提供了丰富的训练样本。该数据集包含多视角视觉观测与关节状态数据，能够有效支持从视觉输入到动作输出的端到端策略学习，尤其适用于复杂精细操作任务的技能迁移研究。

衍生相关工作

基于该数据集衍生的研究包括结合时空注意力机制的模仿学习框架，以及多任务强化学习在精细操作中的探索。相关成果进一步推动了LeRobot生态系统中行为克隆算法的演进，为开源机器人学习社区提供了重要的基准测试平台。

数据集最近研究