Robotic Manipulation Offline Compositional Reinforcement Learning Datasets

github2024-03-19 更新2024-05-31 收录

下载链接：

https://github.com/Lifelong-ML/offline-compositional-rl-datasets

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于离线组合强化学习的机器人操作数据集仓库，数据集通过CompoSuite基准收集，旨在提供大量离线强化学习任务，用于训练多任务离线强化学习代理，并作为研究组合离线强化学习算法的测试平台。

This is a repository for a robot manipulation dataset designed for offline compositional reinforcement learning. The dataset is collected through the CompoSuite benchmark, aiming to provide a vast array of offline reinforcement learning tasks for training multi-task offline reinforcement learning agents. It also serves as a testing platform for researching compositional offline reinforcement learning algorithms.

创建时间：

2023-06-07

原始信息汇总

数据集概述

数据集名称

Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning

数据集来源

该数据集是通过CompoSuite benchmark收集的，该benchmark基于robosuite和Mujoco simulator。

数据集目的

提供大量离线强化学习任务数据，用于训练多任务离线强化学习代理，并作为研究组合离线强化学习算法的测试平台。

数据集存储位置

数据集存储于Dryad，具体链接为https://datadryad.org/stash/dataset/doi:10.5061/dryad.9cnp5hqps。

数据集使用许可

所有数据使用CC0许可，以鼓励开放科学。

训练与测试任务列表

数据集包含多种难度的任务，并提供了几种训练-测试分割列表，包括均匀任务采样、组合任务采样和限制任务采样。这些列表存储在train_test_splits文件夹中，每种配置包含10个随机分割。

数据集结构

数据集下载后需按以下结构整理：

├ root_data
│ ├ expert
│ │ ├ IIWA_Box_None_Push
│ │ ├ ...
│ ├ medium
│ │ ├ ...
│ ├ random
│ │ ├ ...
│ ├ medium-replay-subsampled
│ │ ├ ...

数据集使用方法

训练模型：使用python train_offline.py，可通过设置dataset.split、dataset.type、dataset.seed和algo参数来执行特定的训练配置。
评估模型：使用python evaluate.py，需确保评估配置与训练模型时使用的配置相同。

搜集汇总

数据集介绍

构建方式

该数据集基于CompoSuite基准构建，该基准依托于robosuite平台，并利用Mujoco仿真器进行数据采集。数据集的构建旨在为控制任务提供大规模的离线强化学习任务集合，以支持多任务离线强化学习代理的训练，并为研究组合式离线强化学习算法提供测试平台。数据采集过程中，涵盖了多种机器人操作任务，确保数据的多样性和广泛性。

特点

该数据集的特点在于其任务的多样性和复杂性，涵盖了从简单到复杂的多种机器人操作任务。数据集提供了多种任务列表，包括均匀任务采样、组合任务采样和受限任务采样，以确保实验的可比性。此外，数据集通过Dryad平台以CC0许可证发布，鼓励开放科学和数据共享。数据集的结构清晰，便于用户根据需求进行自定义任务分割和实验配置。

使用方法

使用该数据集时，用户需首先通过GitHub克隆CompoSuite代码库，并安装相关依赖。数据集下载后，需按照指定的文件夹结构进行组织，以便于训练和评估脚本的正确运行。用户可通过配置训练脚本中的参数，选择不同的数据集类型、任务分割方式和算法进行模型训练。训练完成后，使用评估脚本对模型进行性能评估。整个过程支持灵活的参数配置，便于用户根据具体需求进行实验设计和结果验证。

背景与挑战

背景概述

Robotic Manipulation Offline Compositional Reinforcement Learning Datasets 是由Lifelong-ML团队基于CompoSuite基准和robosuite框架，利用Mujoco模拟器构建的离线强化学习数据集。该数据集旨在为多任务离线强化学习代理的训练提供丰富的任务集合，并为研究组合式离线强化学习算法提供实验平台。数据集通过Dryad平台公开发布，采用CC0许可，以促进开放科学的发展。其核心研究问题在于如何通过离线数据训练出能够适应多种复杂任务的机器人控制策略，推动了机器人操作与强化学习领域的交叉研究。

当前挑战

该数据集在解决机器人操作任务中的离线强化学习问题时，面临多重挑战。首先，机器人操作任务的多样性和复杂性使得数据集的构建需要涵盖广泛的任务场景，以确保模型的泛化能力。其次，离线强化学习算法在处理高维状态空间和动作空间时，容易受到数据分布偏移和样本效率低下的影响，这要求数据集在设计和采集过程中必须充分考虑数据的多样性和质量。此外，数据集的构建依赖于模拟器，模拟环境与真实世界的差异可能导致模型在实际应用中的性能下降，如何缩小这一差距是亟待解决的问题。

常用场景

经典使用场景

在机器人操作领域，离线强化学习（Offline Reinforcement Learning）的研究日益受到关注。Robotic Manipulation Offline Compositional Reinforcement Learning Datasets为研究者提供了一个丰富的多任务数据集，用于训练和评估离线强化学习算法。该数据集通过CompoSuite基准测试生成，涵盖了多种机器人操作任务，如推、拉、抓取等，能够有效支持多任务离线强化学习代理的训练和组合式离线强化学习算法的研究。

实际应用

在实际应用中，Robotic Manipulation Offline Compositional Reinforcement Learning Datasets为机器人操作系统的开发和优化提供了重要数据支持。通过该数据集，研究者可以训练出能够在复杂环境中执行多种操作任务的机器人代理，如工业生产线上的自动化操作、仓储物流中的货物搬运等。这些应用不仅提高了机器人操作的效率和精度，还为机器人技术的普及和推广提供了技术保障。

衍生相关工作

该数据集衍生了一系列经典研究工作，主要集中在离线强化学习算法的改进和组合式强化学习算法的探索上。例如，基于该数据集的研究提出了多种离线强化学习算法，如行为克隆（Behavior Cloning）和离线Q学习（Offline Q-Learning），并在组合式任务中验证了其有效性。此外，该数据集还推动了组合式强化学习算法的研究，为多任务学习和迁移学习提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集