garbage-picker-v1-combined

Hugging Face2026-02-14 更新2026-02-15 收录

下载链接：

https://huggingface.co/datasets/Monzzz/garbage-picker-v1-combined

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含机器人控制任务相关的时序数据，主要特征包括6维动作向量（action和actions）、6维状态观测值（observation.state）、时间戳（timestamp）、帧索引（frame_index）、回合索引（episode_index）、样本索引（index）和任务索引（task_index）。所有特征均以数值形式存储，其中动作和状态为float32类型的6维向量，时间戳为float32，各类索引为int64。数据集包含24,096个训练样本，总大小为2,623,459字节，下载压缩包大小为400,496字节。该数据适用于机器人控制、强化学习等时序决策任务的算法训练与评估。

创建时间：

2026-02-13

原始信息汇总

数据集概述

基本信息

数据集名称: garbage-picker-v1-combined
托管平台: Hugging Face
数据集地址: https://huggingface.co/datasets/Monzzz/garbage-picker-v1-combined

数据集结构与特征

数据集包含以下特征字段：

action: 数据类型为列表，元素类型为float32，长度为6。
observation.state: 数据类型为列表，元素类型为float32，长度为6。
timestamp: 数据类型为float32。
frame_index: 数据类型为int64。
episode_index: 数据类型为int64。
index: 数据类型为int64。
task_index: 数据类型为int64。
actions: 数据类型为列表，元素类型为float32，长度为6。

数据划分与规模

数据划分: 仅包含一个划分，名为train。
训练集样本数量: 24096 个示例。
训练集数据大小: 2623459 字节。
数据集总下载大小: 400496 字节。
数据集总大小: 2623459 字节。

配置信息

默认配置名称: default
数据文件路径: 在default配置下，train划分的数据文件路径模式为data/train-*。

搜集汇总

数据集介绍

构建方式

在机器人操作与强化学习领域，高质量的数据集对于算法训练至关重要。garbage-picker-v1-combined数据集通过记录机械臂在模拟环境中执行拾取任务的过程构建而成，其数据采集基于具体的交互轨迹。每条数据样本均包含机械臂的动作指令、环境观测状态以及时间戳、帧索引等元信息，这些结构化数据以分片文件的形式组织，确保了数据的完整性与可访问性，为后续的模型学习提供了坚实的实验基础。

特点

该数据集的核心特征在于其多维度的结构化表示。每个样本不仅精确记录了六维连续动作空间与六维状态观测值，还系统性地标注了时间序列信息、任务索引与回合索引，从而完整保留了智能体与环境交互的动态时序上下文。这种精细的标注方式使得数据集能够支持从行为克隆到离线强化学习等多种机器学习范式，尤其适用于需要分析连续控制与状态转移的研究场景。

使用方法

研究人员可通过HuggingFace数据集库直接加载该数据集，利用其预定义的训练分割进行模型训练与评估。数据以标准化的张量格式呈现，用户可便捷地访问动作、状态及元数据字段，并依据任务索引或回合索引对交互轨迹进行重组与分析。该数据集适用于开发与验证机器人抓取策略、研究离线强化学习算法，或作为仿真到真实世界迁移学习的基准数据源。

背景与挑战

背景概述

在机器人学与强化学习领域，数据驱动的决策模型训练依赖于高质量、大规模的真实世界交互数据。garbage-picker-v1-combined数据集应运而生，专为模拟或实际机器人执行垃圾拾取任务而设计，其核心研究问题聚焦于如何通过观测状态与动作序列数据，优化机器人在复杂动态环境中的自主操作能力。该数据集由相关研究机构构建，旨在推动具身智能与机器人操作技能的学习，通过提供结构化的状态-动作对记录，为算法开发与策略优化奠定了实证基础，对提升机器人在非结构化环境中的适应性与鲁棒性具有重要影响力。

当前挑战

该数据集旨在解决机器人垃圾拾取任务中的自主操作问题，其挑战在于环境的高度不确定性与物体的多样性，要求模型能够从高维观测中精准理解场景并生成鲁棒的动作序列。构建过程中，数据采集面临真实世界噪音干扰、传感器误差以及动作执行的一致性问题，同时需确保数据在时间维度上的连贯性与任务索引的准确性，以支持有效的序列学习与策略泛化。

常用场景

经典使用场景

在机器人操作与强化学习领域，garbage-picker-v1-combined数据集为模拟机械臂抓取与分类任务提供了丰富的轨迹数据。该数据集通过记录机械臂在垃圾分拣环境中的动作序列与状态观测，常被用于训练和评估端到端的强化学习模型，以优化机械臂在复杂动态场景下的决策与控制能力。研究者利用其连续的动作-状态对，能够深入探索策略学习、模仿学习以及多任务泛化等核心问题，为智能体在真实世界中的灵巧操作奠定数据基础。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究工作，包括基于深度确定性策略梯度的连续控制算法优化、结合视觉感知的状态表示学习框架，以及面向多任务学习的层次化策略架构。这些工作不仅提升了机械臂在模拟环境中的分拣性能，还催生了如决策Transformer等序列建模方法在机器人轨迹预测中的应用，持续推动着数据驱动型机器人控制理论的前沿发展。

数据集最近研究