lerobot-feeding-nuts

Hugging Face2025-11-19 更新2025-11-20 收录

下载链接：

https://huggingface.co/datasets/whats2000/lerobot-feeding-nuts

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学数据集，由LeRobot创建。它包含了80个剧集，共计74355帧，专注于一个任务。数据集以Parquet格式存储，并包含了相关视频文件。数据集中的特征包括机器人的动作和状态，以及从不同角度捕获的图像。数据集按照80%的训练集进行划分。

创建时间：

2025-11-16

原始信息汇总

数据集概述

基本信息

数据集名称: lerobot-feeding-nuts
创建工具: LeRobot
许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot

数据集规模

总任务数: 1
总回合数: 80
总帧数: 74355
帧率: 30 FPS
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB

数据结构

数据划分

训练集: 0-80回合

数据特征

动作特征

数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

手腕摄像头:
- 分辨率: 720×1280×3
- 视频编码: av1
- 像素格式: yuv420p
- 非深度图
- 无音频
侧面摄像头:
- 分辨率: 720×1280×3
- 视频编码: av1
- 像素格式: yuv420p
- 非深度图
- 无音频

索引特征

时间戳: float32 [1]
帧索引: int64 [1]
回合索引: int64 [1]
数据索引: int64 [1]
任务索引: int64 [1]

文件格式

数据文件: parquet格式
视频文件: mp4格式

引用信息

主页: 待补充
论文: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，lerobot-feeding-nuts数据集通过LeRobot平台系统采集了80个完整操作序列，涵盖74355帧高精度数据。数据以分块存储形式组织，采用Parquet格式保存动作指令与观测状态，同时配备双视角视频记录，以30帧率捕捉机械臂执行喂食坚果任务的全过程。

特点

该数据集突出表现为多模态融合特性，同步记录六自由度机械臂关节位置参数与双路视觉信息。观测特征包含腕部与侧方视角的720p视频流，动作空间精确映射至各关节控制指令，时间戳与帧索引为时序分析提供支撑，整体数据结构契合强化学习在机器人操控任务中的训练需求。

使用方法

研究者可通过加载标准Parquet文件访问结构化数据，利用动作-观测对构建端到端控制模型。视频数据可通过指定路径调用，帧级元数据支持行为克隆与逆强化学习等任务。全部80个训练集片段适用于机器人技能学习的监督训练与策略评估。

背景与挑战

背景概述

在机器人学习领域，模仿学习作为解决复杂操作任务的关键范式，日益受到学术界与工业界的重视。lerobot-feeding-nuts数据集由HuggingFace的LeRobot项目团队构建，聚焦于精细物体操作任务中的坚果喂食场景。该数据集通过SO101型机器人平台采集了80个完整操作序列，涵盖74355帧多模态数据，包含关节状态控制指令与双视角视觉观测信息，为研究机器人精细操作策略提供了重要实验基础。其结构化存储格式与标准化特征定义，显著提升了机器人行为克隆与强化学习算法的训练效率。

当前挑战

机器人精细操作任务面临动作序列长程依赖与多模态感知融合的核心难题。该数据集构建过程中需克服机械臂轨迹精确同步、双视角视觉数据时空对齐等技术挑战，同时需确保6自由度关节控制指令与高分辨率视频帧的实时匹配精度。数据采集环节涉及传感器噪声抑制、光照条件一致性控制等工程瓶颈，而任务本身对抓取力度控制与物体形变适应提出极高要求，这些因素共同构成了该领域算法研发与系统优化的关键制约。

常用场景

经典使用场景

在机器人操作学习领域，该数据集为模仿学习算法提供了丰富的训练素材。通过80个完整任务片段和超过7万帧的多视角视觉数据，研究人员能够构建端到端的机器人控制策略。数据集包含的关节位置信息和双视角视频序列，为机器人动作预测和轨迹规划研究奠定了坚实基础。

解决学术问题

该数据集有效解决了机器人操作任务中样本效率低下的核心难题。通过提供高质量的真实世界操作数据，显著降低了强化学习算法的探索成本。其精细标注的机械臂关节状态和多模态观测数据，为研究机器人感知-动作映射关系提供了重要支撑，推动了从仿真到实物的技术迁移研究。

衍生相关工作

围绕该数据集衍生的研究工作主要集中在多模态模仿学习框架的构建。研究者利用其丰富的视觉-动作对应关系，开发了基于视觉伺服的控制算法。同时，该数据集也催生了针对长时序操作任务的记忆增强网络架构，为连续操作任务的策略学习提供了新的技术路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集