RLDS

Name: RLDS
Creator: 谷歌研究
Published: 2021-11-04 19:48:19
License: 暂无描述

arXiv2021-11-04 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2111.02767v1

下载链接

链接失效反馈

官方服务：

更多采购需求

资源简介：

RLDS是一个专为强化学习设计的数据集生态系统，由谷歌研究团队开发。该系统支持序列决策制定（SDM）领域的数据记录、回放、操作、注释和共享，特别适用于强化学习（RL）、从演示中学习、离线RL或模仿学习。RLDS不仅支持现有研究的再现性和新数据集的轻松生成，还加速了新研究的进展。通过提供标准和无损的数据集格式，它使得快速测试新算法在更广泛任务上的应用成为可能。此外，RLDS还提供了收集由合成代理或人类生成的数据的工具，以及检查和操作收集数据的功能。最终，通过与TFDS的集成，RLDS促进了RL数据集与研究社区的共享。

RLDS is a dataset ecosystem specifically designed for reinforcement learning, developed by the Google Research team. This system supports data logging, playback, manipulation, annotation, and sharing in the field of sequential decision-making (SDM), and is particularly suitable for reinforcement learning (RL), learning from demonstration, offline RL, and imitation learning. RLDS not only supports the reproducibility of existing research and the easy generation of new datasets, but also accelerates the advancement of new research. By providing a standard and lossless dataset format, it enables rapid testing of new algorithms across a wider range of tasks. In addition, RLDS also provides tools for collecting data generated by synthetic agents or humans, as well as functionalities for inspecting and manipulating the collected data. Ultimately, through integration with TFDS, RLDS facilitates the sharing of RL datasets with the research community.

提供机构：

谷歌研究

创建时间：

2021-11-04

搜集汇总

数据集介绍

构建方式

RLDS数据集的构建采用了模块化工具套件，包括EnvLogger和RLDS Creator。EnvLogger用于记录人工代理与环境的交互，并以开放式格式存储轨迹，同时支持存储元数据。RLDS Creator是一个基于Web的工具，允许人类演示者通过浏览器与环境交互，记录并存储用户动作、环境转换、视觉输出和其他元数据。这两种工具共同构成了RLDS生态系统的基础，确保数据在产生过程中保持了完整性和时间关系。

使用方法

使用RLDS数据集的方法包括三个主要阶段：数据生成、数据消费和数据共享。数据生成阶段，用户可以使用EnvLogger或RLDS Creator来记录人工代理或人类的交互，并存储为RLDS格式。数据消费阶段，研究人员可以利用RLDS提供的工具来设置数据转换流程，将原始数据转换为算法所需的格式。数据共享阶段，RLDS与TFDS集成，使得数据集易于发现和访问，并支持数据所有权和访问控制。此外，RLDS提供了一系列转换工具，用于处理和转换数据集，以便用于各种机器学习算法。

背景与挑战

背景概述

RLDS（Reinforcement Learning Datasets）是一个生态系统，旨在记录、回放、操作、注释和共享顺序决策（SDM）上下文中的数据集，包括强化学习（RL）、从演示中学习、离线RL或模仿学习。RLDS由Google Research和DeepMind的研究人员创建，旨在解决现有RL算法在达到最佳性能时需要大量环境交互的问题。通过提供标准和无损的数据集格式，RLDS允许快速测试新算法，并在更广泛的任务上生成新的数据集。此外，RLDS生态系统使数据集的共享变得容易，并且对底层原始格式保持不可知，以便在大型数据集集合中应用各种数据处理流程。RLDS还提供了收集由合成代理或人类生成的数据的工具，以及用于检查和操作收集到的数据的工具。最终，与TFDS的集成促进了RL数据集的共享，并使研究人员能够轻松地发现和访问数据集。

当前挑战

RLDS面临的挑战包括：1)解决领域问题的挑战：RLDS旨在解决RL算法在达到最佳性能时需要大量环境交互的问题。2)构建过程中的挑战：RLDS需要提供一个标准和无损的数据集格式，以保持所有信息，并且需要开发工具来收集、操作、注释和共享数据集。此外，RLDS需要与TFDS集成，以便轻松地发现和访问数据集，并确保数据集所有者保持对数据的所有权和信誉。

常用场景

经典使用场景

RLDS数据集作为强化学习领域的一个生态系统，其经典使用场景主要在于数据记录、回放、操作、注释和共享。该数据集使得研究者能够轻松地生成新的数据集，并在更广泛的任务范围内快速测试新的算法。RLDS生态系统使得数据集的共享变得简单，并且能够避免信息丢失，同时在使用各种数据处理流程时，对底层原始格式保持无关性。此外，RLDS还提供了用于收集由合成代理或人类生成的数据的工具，以及用于检查和操作收集到的数据的工具。

解决学术问题

RLDS数据集解决了强化学习领域数据使用多样性的问题。由于任务多样，从低数据模式到高数据模式，从访问状态、动作和奖励到仅访问观察，从专家数据到噪声演示，从低覆盖到完整覆盖，从人类演示到合成演示，这种多样性需要大量的数据集。RLDS提供了一个标准的、无损的数据集格式，允许每个数据集与大量的算法一起使用，并允许实践者重用相同的数据管道，以评估现有算法在新数据集上的表现。此外，RLDS还提供了存储时间信息的标准方式，解决了许多开源RL数据集缺乏必要时间信息的问题。

实际应用

RLDS数据集的实际应用场景主要在于数据共享和算法测试。该数据集使得数据集的共享变得简单，不仅能够提高实验的可重复性，还能够加速研究。此外，RLDS提供了一个标准的数据集格式，使得研究者能够快速测试新的算法，并在更广泛的任务范围内进行测试。RLDS还提供了用于收集由合成代理或人类生成的数据的工具，以及用于检查和操作收集到的数据的工具，这些工具在实际应用中具有重要的意义。

数据集最近研究

社区讨论

#经验分享

【我遇到的问题】 • 现象：该数据集的下载链接已失效【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72

5,000+

优质数据集

54 个

任务类型

进入经典数据集