IGLU Datasets
收藏IGLU Datasets 概述
目标与背景 IGLU项目旨在开发能够通过接收到基于自然语言的指令,在协作环境中学习解决任务的交互式代理。项目围绕一个简化的Minecraft风格的有限块世界中的交互任务,目标是使用有限数量的块类型构建结构。
数据集内容 数据集包含多个在块构建任务中不同类型交互的数据集。每个游戏记录对应于建筑师和建造者配对构建目标结构的过程,作为离散的游戏观察序列。每个观察包含时间戳、聊天历史、建造者的位置、建造者的块库存以及构建区域中块的位置。
角色与交互 数据集中的交互涉及两个角色:建筑师和建造者。建筑师提供构建目标结构的指令,建造者则根据指令放置块或请求澄清不明确的指令。
数据集结构 数据集分为单轮和多轮数据集。多轮数据集记录了建筑师和建造者之间的整体协作目标,每个结构有多个协作会话,每个会话包含一系列“回合”,每个回合代表一个原子指令及其在块世界中的相应变化。单轮数据集则从随机链步骤分支出任务,不形成链结构。
数据集使用
使用IGLU-datasets库可以轻松灵活地处理单轮和多轮数据集。通过创建MultiturnDataset或SingleturnDataset实例,可以自动下载并解析数据集。数据集的样本可以通过.sample()方法随机获取,样本包含对话历史、指令、目标网格和起始网格等信息。
评估方法 数据集提供了基于网格预测的评分计算方法,通过比较预测网格与目标网格的相似性来计算交集得分,该得分可用于评估模型性能或作为强化学习代理的奖励函数。
人类评估数据 数据集还包括了2022年IGLU挑战赛前两名代理的人类评估数据,包含人类评估者的反馈和游戏数据。
参考文献 使用数据集的研究应引用相关论文,详细描述了数据集的收集和应用。




