five

GF-Minecraft

收藏
arXiv2025-01-15 更新2025-01-16 收录
下载链接:
https://vvictoryuki.github.io/gamefactory/
下载链接
链接失效反馈
官方服务:
资源简介:
GF-Minecraft数据集是由香港大学和快手科技联合创建的高质量动作标注视频数据集,主要用于生成式游戏引擎的研究。该数据集包含70小时的Minecraft游戏视频,涵盖了多样化的游戏场景和天气条件,并通过预训练的多模态大语言模型MiniCPM进行文本描述标注。数据集的创建过程通过执行预定义的动作序列来消除人类偏见,确保动作分布的平衡。GF-Minecraft数据集的应用领域主要集中在生成式游戏引擎的开发,旨在解决现有游戏生成方法在场景泛化方面的局限性,推动AI驱动的游戏内容生成技术的发展。

The GF-Minecraft dataset is a high-quality action-annotated video dataset jointly created by the University of Hong Kong and Kuaishou Technology, primarily intended for the research of generative game engines. This dataset encompasses 70 hours of Minecraft game videos, covering a diverse range of gaming scenarios and weather conditions, and is annotated with text descriptions through the pre-trained multimodal large language model MiniCPM. The dataset creation process eliminates human bias by executing predefined action sequences, ensuring a balanced distribution of actions. The application domain of the GF-Minecraft dataset is focused on the development of generative game engines, aiming to address the limitations of existing game generation methods in terms of scene generalization and to promote the development of AI-driven game content generation technology.
提供机构:
香港大学, 快手科技
创建时间:
2025-01-15
搜集汇总
数据集介绍
main_image_url
构建方式
GF-Minecraft数据集的构建基于Minecraft游戏平台,利用其丰富的API捕捉环境快照,并通过预定义的动作序列生成70小时的游戏视频。为了消除人类玩家行为带来的偏差,数据集中的动作频率和持续时间被均匀采样,并随机组合以增强动作的泛化能力。此外,数据集涵盖了多种生物群落、天气条件和时间变化,进一步提升了场景的多样性。每个视频片段均通过多模态大语言模型MiniCPM-V进行文本标注,确保场景描述的准确性。
特点
GF-Minecraft数据集的特点在于其高质量和多样性。首先,数据集通过Minecraft的开放世界环境生成了丰富的场景,涵盖了森林、平原和沙漠等多种生物群落,以及晴天、雨天和雷暴等天气条件。其次,数据集的动作空间复杂且可定制,支持键盘和鼠标输入的组合,避免了人类玩家行为带来的偏差。此外,数据集还提供了详细的文本描述,增强了场景的语义信息,为生成式游戏引擎的研究提供了坚实的基础。
使用方法
GF-Minecraft数据集主要用于训练生成式游戏引擎中的动作控制模块。通过将预训练的视频生成模型与少量标注动作数据结合,研究人员可以实现对开放域场景的动作控制。具体而言,数据集可用于多阶段训练策略,首先通过LoRA微调模型以适应游戏视频风格,随后训练动作控制模块以实现风格独立的动作控制。最终,该模型能够在开放域场景中生成无限长度的交互式游戏视频,为游戏开发提供了新的可能性。
背景与挑战
背景概述
GF-Minecraft数据集由香港大学和快手技术的研究团队于2025年创建,旨在推动生成式游戏引擎的发展。该数据集基于Minecraft游戏,通过捕捉游戏中的第一人称视角视频,结合动作标注,为生成式游戏视频模型提供了高质量的训练数据。GF-Minecraft的核心研究问题在于如何通过小规模的动作标注数据,结合预训练的视频生成模型,实现开放域场景的泛化,从而生成多样化的游戏视频。这一研究为生成式游戏引擎的自动化和创新提供了新的可能性,推动了游戏开发领域的AI技术应用。
当前挑战
GF-Minecraft数据集面临的主要挑战包括两个方面。首先,在领域问题方面,生成式游戏引擎需要解决场景泛化的难题,即如何从有限的游戏数据中学习动作控制,并将其推广到开放域场景中。现有的方法往往局限于特定游戏风格,难以生成全新的游戏场景。其次,在数据集构建过程中,动作标注的成本高昂且容易引入人为偏差,如何在不依赖大规模标注数据的情况下,利用开放域视频的生成先验知识,成为数据集构建的关键挑战。此外,如何在保持开放域生成能力的同时,实现精确的动作控制,也是该数据集面临的技术难题。
常用场景
经典使用场景
GF-Minecraft数据集在生成式游戏引擎的研究中具有重要地位,尤其是在探索场景泛化能力的领域。该数据集通过结合Minecraft游戏中的动作标注视频,为生成式视频模型提供了丰富的训练数据,使得模型能够在开放域场景中生成多样化的游戏视频。经典的使用场景包括通过预训练的视频扩散模型,结合GF-Minecraft数据集中的动作控制模块,生成全新的游戏场景,从而推动生成式游戏引擎的发展。
实际应用
GF-Minecraft数据集的实际应用场景广泛,尤其是在游戏开发和虚拟现实领域。通过该数据集,开发者能够快速生成多样化的游戏场景,减少手动设计的工作量。此外,该数据集还可用于训练游戏AI代理,使其在复杂的虚拟环境中进行自主学习和决策。这种技术不仅能够降低游戏开发成本,还能为玩家提供更加丰富和个性化的游戏体验。
衍生相关工作
GF-Minecraft数据集衍生了一系列相关研究工作,尤其是在生成式游戏引擎和动作控制领域。基于该数据集,研究人员提出了多阶段训练策略,将游戏风格学习与动作控制解耦,从而实现了开放域场景的泛化。此外,该数据集还启发了其他研究团队探索生成式世界模型的应用,如自动驾驶和机器人仿真等领域。这些工作进一步推动了生成式AI技术在游戏和虚拟现实中的应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作