garbage-picker-v1-10

Hugging Face2026-02-14 更新2026-02-15 收录

下载链接：

https://huggingface.co/datasets/Monzzz/garbage-picker-v1-10

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个与机器人技术相关的数据集，使用LeRobot创建。数据集包含训练集，共有5709个样本，总大小为479556字节。数据集的特征包括动作（6个浮点数）、观察状态（6个浮点数）、时间戳、帧索引、集索引、索引和任务索引。此外，数据集还包含来自前部、顶部和腕部摄像头的视频数据，视频分辨率为720x1280，帧率为30fps。数据集的结构和元数据在meta/info.json中有详细描述，包括机器人类型、总集数、总帧数、总任务数、块大小、数据文件和视频文件的大小等。数据集的许可证为Apache-2.0。

创建时间：

2026-02-13

原始信息汇总

数据集概述

基本信息

数据集名称: garbage-picker-v1-10
发布者: Monzzz
许可证: Apache License 2.0
任务类别: 机器人学
标签: LeRobot
创建工具: 使用 LeRobot 创建。

数据集规模与结构

数据总量: 479,556 字节
下载大小: 111,025 字节
唯一配置: default
数据划分: 仅包含 train 划分。
- 训练集样本数: 5,709 个
- 训练集大小: 479,556 字节

数据内容详情

数据集包含机器人操作序列数据，具体特征如下：

核心特征

actions
- 类型: list
- 数据类型: float32
- 长度: 6
- 描述: 机器人的动作指令。
observation.state
- 类型: list
- 数据类型: float32
- 长度: 6
- 描述: 机器人的状态观测值。
timestamp
- 类型: float32
- 描述: 时间戳。
frame_index
- 类型: int64
- 描述: 帧索引。
episode_index
- 类型: int64
- 描述: 回合（episode）索引。
index
- 类型: int64
- 描述: 数据索引。
task_index
- 类型: int64
- 描述: 任务索引。

元数据信息（来自 `meta/info.json`）

代码库版本: v3.0
机器人类型: so_follower
总回合数: 10
总帧数: 5,709
总任务数: 1
数据块大小: 1,000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据划分映射: "train": "0:10"

扩展特征定义

元数据中定义了更详细的特征结构，部分特征在提供的 dataset_info 中未直接列出，但存在于数据文件中：

action 与 observation.state: 均对应6个关节的位置（shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos）。
图像观测: 包含三个视角的视频数据：
- observation.images.front (前视)
- observation.images.top (顶视)
- observation.images.wrist (腕部视角)
- 视频规格: 分辨率 1280x720，3通道（RGB），编码格式 AV1，帧率 30 FPS，无音频。

文件路径模式

数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

补充说明

主页链接: [More Information Needed]
相关论文: [More Information Needed]
引用信息（BibTeX）: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。garbage-picker-v1-10数据集依托LeRobot平台构建，通过实际部署SO Follower型机器人，系统采集了10个完整操作序列。数据以30帧每秒的速率记录，涵盖机器人关节状态与多视角视觉信息，并以分块Parquet格式高效存储，确保了时序动作与观测轨迹的同步性与完整性。

特点

该数据集的核心特征在于其多维度的观测空间与精细的动作标注。数据集不仅提供了六自由度机械臂的关节位置作为动作与状态向量，还同步收录了前置、顶部及腕部三个视角的高清视频流，分辨率达1280x720，为算法提供了丰富的环境上下文。所有数据均按时间戳、帧索引与回合索引严格对齐，结构清晰，便于研究者提取时空关联特征，适用于复杂操作任务的端到端学习。

使用方法

为有效利用本数据集，研究者可借助LeRobot或兼容的机器人学习框架进行加载与预处理。数据按训练集划分，可直接用于行为克隆、逆动力学模型训练或视频预测等任务。使用时需注意解析Parquet文件中的动作序列、状态向量及对应的MP4视频路径，通过帧索引实现多模态数据对齐。该数据集的设计支持高效流式读取，适合大规模分布式训练，助力机器人抓取与操作策略的研发。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习是推动智能体掌握复杂操作任务的关键范式。garbage-picker-v1-10数据集依托HuggingFace的LeRobot平台构建，专注于机器人拾取垃圾这一具身智能任务。该数据集收录了多视角视觉观测与六自由度机械臂关节状态及动作数据，旨在为机器人操作技能的数据驱动研究提供高质量的真实世界交互轨迹。尽管其创建时间与具体研究团队信息尚未公开，但数据集的结构设计反映了当前机器人学习对多模态、时序化演示数据的迫切需求，有望促进家庭服务机器人等场景中灵巧操作算法的进步。

当前挑战

该数据集致力于解决机器人垃圾拾取任务中的模仿学习与策略泛化挑战，其核心难点在于如何从有限演示中学习鲁棒且可迁移的操作策略，以应对真实环境中物体位置、形状及光照的动态变化。在构建过程中，数据采集面临诸多挑战：多摄像头同步与校准确保视觉观测的一致性，机械臂动作的精确记录需克服传感器噪声与延迟，而大规模视频数据的存储与高效处理则对计算资源提出较高要求。此外，演示数据的质量与多样性直接制约学习模型的性能，如何设计采集协议以覆盖足够的状态-动作空间亦是关键难题。

常用场景

经典使用场景

在机器人学习领域，garbage-picker-v1-10数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集记录了六自由度机械臂在垃圾分拣任务中的关节状态、动作序列及多视角视觉观测，其经典使用场景在于训练端到端的机器人控制策略。研究人员能够利用这些时序数据，构建从视觉输入到关节动作的映射模型，从而模拟人类操作员在复杂环境中的决策过程，推动机器人自主执行精细操作任务的发展。

解决学术问题

该数据集有效解决了机器人学中样本效率低下与泛化能力不足的学术难题。通过提供真实世界采集的多模态交互数据，它支持数据驱动的策略学习，降低了仿真到现实迁移的鸿沟。在学术研究中，数据集助力探索视觉-动作联合表征、时序决策建模以及多任务学习等核心问题，为机器人适应动态非结构化环境提供了实证基础，促进了具身智能理论的深化与算法创新。

衍生相关工作

围绕该数据集，已衍生出一系列经典研究工作，特别是在机器人模仿学习与视觉运动控制领域。例如，基于LeRobot框架的基准算法比较与策略优化研究，利用该数据验证了分层强化学习、行为克隆及元学习方法的有效性。这些工作不仅提升了机械臂在垃圾分拣任务中的性能，还推动了多传感器融合、跨任务迁移等技术的进步，为开源机器人社区提供了可复现的实验基础与算法范例。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集