GF-Minecraft Dataset
收藏数据集概述
数据集名称
GameFactory: Creating New Games with Generative Interactive Videos
数据集简介
GameFactory 是一个新颖的框架,旨在解决游戏视频生成中的场景泛化问题。现有方法通常在固定风格和环境中表现不佳,限制了其创建多样化和新颖游戏的能力。GameFactory 通过将预训练的大型视频生成模型的开放域生成能力与从小规模高质量数据集(GF-Minecraft)学习的动作控制模块相结合,实现了这一目标。这种解耦的游戏风格学习和动作控制通过多阶段训练策略实现,使框架在保持开放域泛化能力的同时,能够生成动作可控的视频。
数据集发布
- 发布日期:2025年1月14日
- 发布内容:论文、项目页面、数据集
GF-Minecraft 数据集
数据集介绍
GF-Minecraft 数据集旨在满足动作可控视频生成的三个关键需求:
- 可定制的动作:用于低成本、大规模数据收集。
- 无偏的动作序列:确保多样化和低概率的动作组合。
- 多样化的场景:带有文本描述,捕捉场景特定的物理动态。
数据收集平台
使用 Minecraft 作为数据收集平台,因其全面的API、多样化的开放世界环境和广泛的动作空间。
数据集内容
- 70小时的游戏视频:带有动作注释。
- 超过2000个视频片段:每个片段包含2000帧,并配有由多模态语言模型 MiniCPM-V 生成的文本描述。
文件结构
数据集可从 HuggingFace 下载,文件结构如下:
GF-Minecraft ├── data_2003 │ ├── part_aa │ ├── part_ab │ ├── part_ac │ ├── part_ad │ ├── part_ae │ └── part_af └── data_269.zip
目录详情
annotation.csv:包含所有视频片段的文本描述。metadata/:包含每个视频片段的详细元数据的JSON文件。video/:包含视频文件(.mp4格式)。
JSON文件详情
每个JSON文件提供对应视频片段的详细元数据,最重要的信息是 actions 字段,描述视频中执行的动作序列。
有用脚本
detection.py:检测并标记无效跳跃和碰撞。visualize.py:允许用户在输入视频上注释动作信息并保存为带注释的视频。
引用
如果发现我们的工作有帮助,请引用我们的论文: bibtex @misc{yu2025gamefactory, title={GameFactory: Creating New Games with Generative Interactive Videos}, author={Yu, Jiwen and Qin, Yiran and Wang, Xintao and Wan, Pengfei and Zhang, Di and Liu, Xihui}, year={2025}, eprint={xxxxxxxx}, archivePrefix={arXiv}, }




