MineRL

Name: MineRL
Creator: 卡内基梅隆大学
Published: 2019-07-30 02:10:30
License: 暂无描述

arXiv2019-07-30 更新2024-06-21 收录

下载链接：

http://minerl.io

下载链接

链接失效反馈

官方服务：

资源简介：

MineRL是由卡内基梅隆大学创建的大型数据集，包含超过6000万条在Minecraft游戏中的自动标注状态-动作对。数据集涵盖多种相关任务，旨在支持深度强化学习和模仿学习方法的研究。创建过程中，通过公开游戏服务器收集玩家的游戏数据，并进行自动标注。MineRL的应用领域广泛，主要用于解决强化学习中的样本效率问题，特别是在需要大量样本的复杂环境中。

MineRL is a large-scale dataset developed by Carnegie Mellon University, which contains over 60 million automatically annotated state-action pairs generated within the Minecraft game environment. The dataset covers a diverse set of related tasks, and is designed to support research on deep reinforcement learning and imitation learning methodologies. During its creation, player gameplay data was collected through public game servers and automatically annotated. MineRL has broad application domains, and is mainly utilized to tackle the sample efficiency problem in reinforcement learning, particularly in complex scenarios that demand large volumes of training samples.

提供机构：

卡内基梅隆大学

创建时间：

2019-07-30

搜集汇总

数据集介绍

构建方式

MineRL数据集的构建方法采用了创新的收集方案，通过记录Minecraft游戏玩家的数据包级信息，实现了玩家视角和行为的完美重建。这个平台允许持续引入新任务，并自动标注以补充当前和未来的方法。数据收集过程中，玩家首先在网页上提供同意书，然后下载一个插件记录游戏中的所有数据包信息，这些信息随后被传输到MineRL数据仓库。数据管道能够将记录的数据重新模拟、修改和增强，为不同的算法提供可消费的数据格式。

特点

MineRL数据集的特点在于其规模庞大、结构化和高质量。该数据集包含超过6000万个人工标注的状态-动作对，涵盖了Minecraft中的各种相关任务。MineRL数据集具有层次性、多样性和规模性，能够为研究人员提供一个实验和基准测试的平台，以促进新方法的研究。此外，MineRL数据集还展示了Minecraft领域的难度，以及其在开发解决关键研究挑战的技术方面的潜力。

使用方法

MineRL数据集的使用方法包括下载数据集，并使用相关的工具和API进行数据处理和分析。数据集以Zip压缩文件的形式提供，每个任务家族都有一个文件夹，每个演示都有一个子文件夹。状态和动作以H.264压缩的MP4视频形式存储，非视觉特征和玩家动作以JSON文件形式存储。此外，对于特定的任务配置，还提供了Numpy .npz文件，其中包含状态-动作-奖励元组。研究人员可以使用这些数据来训练和评估强化学习算法，并进行相关的实验研究。

背景与挑战

背景概述

MineRL数据集是卡内基梅隆大学的研究团队于2019年创建的一个大规模、结构化的人机交互数据集。该数据集旨在解决深度强化学习方法的样本效率问题，这些问题在现实世界中的应用受到了限制。MineRL数据集由超过6000万个自动标注的状态-动作对组成，涵盖了Minecraft游戏中各种相关任务。该数据集的创建旨在为研究人员提供一个实验和基准测试平台，以促进使用人类示例的新方法的发展。MineRL数据集的引入对相关领域产生了重要影响，为强化学习、模仿学习和多任务学习等领域的研究提供了丰富的数据资源。

当前挑战

MineRL数据集面临的主要挑战包括：1)解决领域问题：MineRL旨在解决深度强化学习方法在样本效率方面的挑战，使其能够应用于更复杂的现实世界问题。2)构建过程中的挑战：MineRL数据集的构建过程中遇到了数据收集、标注和存储等方面的挑战。为了解决这些问题，MineRL团队开发了一个新的平台和方法，用于持续收集Minecraft中的人类演示，并自动标注以支持当前和未来的方法。

常用场景

经典使用场景

MineRL数据集提供了一个大规模、结构化的Minecraft演示数据集，旨在解决强化学习中的样本效率问题。该数据集包含超过6000万个自动标注的状态-动作对，跨越了Minecraft中各种相关任务。MineRL数据集的独特之处在于其数据收集方案，它允许不断引入新任务，并收集适用于各种方法的完整状态信息。MineRL数据集展示了层次性、多样性和规模，使得研究人员能够利用人类演示数据来提高强化学习方法的样本效率。

衍生相关工作

MineRL数据集衍生了大量的相关工作。例如，研究人员可以利用MineRL数据集来开发新的强化学习和模仿学习方法，以提高这些方法的样本效率。此外，研究人员还可以利用MineRL数据集来研究和解决Minecraft领域中的一些关键研究挑战，例如开放世界多智能体交互、长期规划、视觉、控制和导航等。此外，MineRL数据集还可以作为数据增强技术的数据来源，帮助研究人员提高强化学习方法的样本效率。

数据集最近研究