teamcraft_data
收藏Hugging Face2024-12-01 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/teamcraft/teamcraft_data
下载链接
链接失效反馈官方服务:
资源简介:
TeamCraft数据集旨在基准测试Minecraft中的多模态、多智能体协作。该数据集包含55,000个任务变体,每个任务由多模态提示和程序生成的专家演示定义。数据集包括多模态提示(语言+图像)、观察和动作。数据集以集中式和分布式两种格式提供,每种格式包含超过一百万张图像和一个训练JSON文件。涵盖的任务包括建造、清理、耕作和冶炼。该数据集支持多智能体强化学习、多模态学习和协作环境中的具身AI研究。
创建时间:
2024-11-21
原始信息汇总
TeamCraft 数据集概述
基本信息
- 许可证: Apache License 2.0
- 语言: 英语
- 标签:
- Minecraft
- 多智能体
- 多模态
- 基准测试
- 数据量: 10K < n < 100K
数据集结构
特征
- task_variants: 55,000 个程序生成的任务变体。
- demonstrations: 多模态提示(语言 + 图像)、观察和动作。
- observations: 第一人称 RGB 视图和库存状态。
- agent_actions: 每个智能体的时间步动作。
数据分割
- train: 大于 55,000 条记录
- valid: 1000 条记录
数据集格式
- TeamCraft-Data-Cen: 适用于集中式模型的数据集。
- TeamCraft-Data-Dec: 适用于分散式模型的数据集。
任务类型
- Building: 根据提供的蓝图构建结构。
- Clearing: 从目标区域移除指定方块。
- Farming: 在指定农田上播种和收获作物。
- Smelting: 使用熔炉将资源熔炼成目标物品。
应用领域
- 多智能体强化学习
- 多模态学习和任务规划
- 协作环境中的具身 AI
使用方法
- 模型训练和评估可在 TeamCraft GitHub Repository 进行。
免责声明
- 该数据集仅用于研究目的。用户需确保遵守适用的法律法规。创建者不保证数据集适用于任何特定目的,也不对因使用数据集而产生的任何后果负责。
许可证
- 该数据集基于 Apache License 2.0 发布。
搜集汇总
数据集介绍

构建方式
TeamCraft数据集的构建旨在推动多模态、多智能体协作在Minecraft环境中的应用。该数据集通过多模态提示和程序化生成的专家演示,定义了55,000种任务变体。数据集的构建过程包括生成任务类型、智能体数量、正交视图、智能体观察序列以及智能体间的对话序列。这些数据通过图像和JSON文件的形式存储,确保了数据的多模态性和多样性。
特点
TeamCraft数据集的显著特点在于其多模态和多智能体的特性。数据集包含了丰富的图像数据,涵盖了智能体的观察序列和任务执行的正交视图,同时通过对话序列记录了智能体间的交互。此外,数据集提供了多种任务类型,如建筑、清理、耕作和熔炼,支持多智能体强化学习和任务规划的研究。
使用方法
使用TeamCraft数据集时,用户可以下载并解压包含验证集的zip文件,或访问GitHub仓库获取训练集的两种格式:集中式模型数据(TeamCraft-Data-Cen)和分布式模型数据(TeamCraft-Data-Dec)。数据集支持在多智能体强化学习、多模态学习和任务规划等领域的模型训练和评估,具体实现可参考TeamCraft GitHub仓库中的相关文档和代码。
背景与挑战
背景概述
TeamCraft数据集,由专业的研究团队精心打造,旨在推动多模态、多智能体协作在Minecraft环境中的应用。该数据集包含了55,000种任务变体,这些任务通过多模态提示和程序生成的专家演示来定义,为研究者提供了一个丰富的实验平台。数据集的创建不仅展示了多智能体系统在复杂环境中的潜力,还为多模态学习和任务规划领域提供了宝贵的资源。通过提供大规模的图像数据和详细的任务描述,TeamCraft数据集极大地促进了多智能体强化学习和协作环境中的具身AI研究。
当前挑战
TeamCraft数据集在构建过程中面临了多项挑战。首先,多模态数据的整合要求对不同类型的输入(如图像和文本)进行有效的处理和融合,这对数据处理技术提出了高要求。其次,多智能体协作任务的设计和生成需要确保任务的多样性和复杂性,以模拟真实世界中的协作场景。此外,数据集的规模和复杂性也带来了存储和计算资源的挑战,特别是在处理超过一百万张图像和大规模JSON文件时。最后,确保数据集在不同模型(如集中式和分散式模型)中的适用性,需要进行细致的格式和结构设计。
常用场景
经典使用场景
TeamCraft数据集的经典使用场景主要集中在多模态、多智能体协作任务的开发与评估。该数据集通过在Minecraft环境中提供55,000种任务变体,支持构建、清理、耕作和熔炼等多种任务的演示,为研究者提供了丰富的多模态提示和程序生成的专家示范。这些任务不仅涵盖了视觉和语言信息的融合,还涉及多个智能体之间的协同工作,为多智能体强化学习和任务规划提供了理想的实验平台。
衍生相关工作
TeamCraft数据集的发布催生了一系列相关研究工作,特别是在多智能体强化学习和多模态学习领域。研究者们基于该数据集开发了多种模型,用于解决智能体间的协作与通信问题。例如,有研究提出了基于该数据集的多模态融合算法,以提高智能体在复杂任务中的表现。此外,该数据集还激发了在 embodied AI 领域的进一步探索,推动了虚拟环境中任务规划和执行算法的创新与发展。
数据集最近研究
最新研究方向
在多模态与多智能体协作领域的研究中,TeamCraft数据集因其独特的Minecraft环境设置而备受瞩目。该数据集不仅提供了丰富的任务变体,还通过多模态提示和程序化生成的专家演示,推动了多智能体强化学习、任务规划及具身AI在协作环境中的应用研究。近年来,研究者们聚焦于如何利用该数据集优化多智能体间的通信与协作策略,特别是在复杂任务如建筑、农业和冶炼中的表现。此外,该数据集的多模态特性也激发了跨模态学习算法的发展,旨在提升智能体在视觉与语言信息融合中的决策能力。这些前沿研究不仅深化了对多智能体系统的理解,也为未来在虚拟与现实世界中的协作应用奠定了基础。
以上内容由遇见数据集搜集并总结生成



