GF-Minecraft Dataset
收藏数据集概述
数据集名称
GameCrypto: Creating New Games with Generative Interactive Videos
数据集简介
GameCrypto 是一个新颖的框架,旨在解决游戏视频生成中的场景泛化问题。现有的方法通常在固定风格和环境中表现不佳,限制了其创建多样化和新颖游戏的能力。GameCrypto 通过结合预训练的大型视频生成模型和从小型高质量数据集 GF-Minecraft 中学习的动作控制模块,实现了这一目标。该框架通过多阶段训练策略,将游戏风格学习和动作控制解耦,从而保留了其开放域泛化能力,同时实现了动作可控的视频生成。
数据集发布
GF-Minecraft 数据集
1. 数据集介绍
GF-Minecraft 数据集旨在满足动作可控视频生成的三个关键需求:
- 可定制的动作:用于低成本、大规模数据收集。
- 无偏的动作序列:确保多样化和低概率的动作组合。
- 多样化的场景:带有文本描述,捕捉场景特定的物理动态。
使用 Minecraft 作为数据收集平台,因其全面的API、多样化的开放世界环境和广泛的动作空间。通过执行预定义的随机动作序列,收集了 70小时的游戏视频,并带有动作注释。
2. 文件结构
数据集可以从 HuggingFace 下载,文件结构如下:
GF-Minecraft ├── data_2003 │ ├── part_aa │ ├── part_ab │ ├── part_ac │ ├── part_ad │ ├── part_ae │ └── part_af └── data_269.zip
合并部分文件后,数据集结构如下:
GF-Minecraft ├── data_2003 │ ├── annotation.csv │ ├── metadata │ │ ├── seed_1_part_1.json │ │ ├── seed_2_part_2.json │ │ ├── seed_3_part_3.json │ │ └── ... │ └── video │ ├── seed_1_part_1.mp4 │ ├── seed_2_part_2.mp4 │ ├── seed_3_part_3.mp4 │ └── ... └── data_269 ├── annotation.csv ├── metadata │ ├── seed_1_part_1.json │ ├── seed_2_part_2.json │ ├── seed_3_part_3.json │ └── ... └── video ├── seed_1_part_1.mp4 ├── seed_2_part_2.mp4 ├── seed_3_part_3.mp4 └── ...
3. 文件详情
annotation.csv:包含所有视频剪辑的文本描述。metadata/:包含每个视频剪辑的详细元数据。video/:包含.mp4格式的视频文件。
4. JSON 文件详情
每个 JSON 文件包含以下关键信息:
- actions:描述视频中执行的动作序列。
- biome:视频记录的地形类型。
- initial_weather:视频开始时的天气条件。
- start_time:视频开始的时间。
5. 实用脚本
detection.py:检测无效跳跃和碰撞。visualize.py:可视化动作信息并生成注释视频。




