CounterStrike_Deathmatch|游戏AI数据集|行为克隆数据集
收藏Counter-Strike Deathmatch 数据集概述
数据集来源
- 数据集由 Tim Pearce 和 Jun Zhu 在 IEEE Conference on Games (CoG) 2022 上发表的论文《Counter-Strike Deathmatch with Large-Scale Behavioural Cloning》中提出。
- 论文链接:https://arxiv.org/abs/2104.04258
- CoG 论文链接:https://ieee-cog.org/2022/assets/papers/paper_45.pdf
数据集组成
数据集包含多个子集,具体如下:
主要数据集
- 文件名:
hdf5_dm_july2021_*_to_*.tar
- 文件数量: 5500
- 总大小: 700 GB
- 地图: dust2
- 游戏模式: deathmatch
- 来源: 从在线服务器抓取
专家数据集
-
文件名:
dataset_dm_expert_dust2/hdf5_dm_july2021_expert_*.hdf5
- 文件数量: 190
- 总大小: 24 GB
- 地图: dust2
- 游戏模式: deathmatch
- 来源: 手动创建,清洁动作
-
文件名:
dataset_aim_expert/hdf5_aim_july2021_expert_*.hdf5
- 文件数量: 45
- 总大小: 6 GB
- 地图: aim map
- 游戏模式: aim mode
- 来源: 手动创建,清洁动作
-
文件名:
dataset_dm_expert_othermaps/hdf5_dm_nuke_expert_*.hdf5
- 文件数量: 10
- 总大小: 1 GB
- 地图: nuke
- 游戏模式: deathmatch
- 来源: 手动创建,清洁动作
-
文件名:
dataset_dm_expert_othermaps/hdf5_dm_mirage_expert_*.hdf5
- 文件数量: 10
- 总大小: 1 GB
- 地图: mirage
- 游戏模式: deathmatch
- 来源: 手动创建,清洁动作
-
文件名:
dataset_dm_expert_othermaps/hdf5_dm_inferno_expert_*.hdf5
- 文件数量: 10
- 总大小: 1 GB
- 地图: mirage
- 游戏模式: deathmatch
- 来源: 手动创建,清洁动作
元数据
- 文件名:
dataset_metadata/currvarsv2_dm_july2021_*_to_*.npy, currvarsv2_dm_july2021_expert_*_to_*.npy, currvarsv2_dm_mirage_expert_1_to_100.npy, currvarsv2_dm_inferno_expert_1_to_100.npy, currvarsv2_dm_nuke_expert_1_to_100.npy, currvarsv2_aim_july2021_expert_1_to_100.npy
- 文件数量: 61
- 总大小: 6 GB
- 地图: 根据文件名
- 游戏模式: 根据文件名
- 来源: 根据文件名
位置追踪备份
- 文件名:
location_trackings_backup/
- 文件数量: 305
- 总大小: 0.5 GB
- 地图: dust2
- 游戏模式: deathmatch
- 来源: 包含用于计算地图覆盖分析的元数据
数据文件结构
.hdf5 文件结构
- 内容: 包含1000帧(约1分钟)的游戏画面和处理后的动作标签。
- 格式: .hdf5 格式,便于快速数据加载。
- 键值:
frame_i_x
: 图像frame_i_xaux
: 包含前一时间步的动作、生命值、弹药和队伍信息。frame_i_y
: 包含目标动作的扁平化向量形式。frame_i_helperarr
: 包含击杀和死亡标志的二进制变量。
.npy 文件结构
- 内容: 包含与100个.hdf5文件对应的元数据。
- 格式: .npy 格式。
- 键值:
file_numi_frame_j
: 文件编号和帧编号。curr_vars
: 包含原始抓取的元数据。infer_a
: 推断的动作,包含按键、鼠标位置和点击信息。frame_i_helperarr
: 重复.hdf5文件中的信息。
训练模型
- 模型: 提供四个训练模型,包括“非状态”和“状态”版本。
- 文件名:
trained_models.zip
ak47_sub_55k_drop_d4
: 仅在AK47序列上预训练。ak47_sub_55k_drop_d4_dmexpert_28
: 在专家死亡竞赛数据上微调。ak47_sub_55k_drop_d4_aimexpertv2_60
: 在aim模式专家数据上微调。July_remoterun7_g9_4k_n32_recipe_ton96__e14
: 在整个数据集上预训练。
其他使用该数据集的工作
- Imitating Human Behaviour with Diffusion Models, ICLR 2023: https://arxiv.org/abs/2301.10677
- Diffusion for World Modeling: Visual Details Matter in Atari, NeurIPS 2024: https://arxiv.org/pdf/2405.12399

Solar Radiation Data
该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。
www.nrel.gov 收录
中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录
Titanic Dataset
Titanic Data Analysis: A Journey into Passenger Profiles and Survival Dynamics
kaggle 收录
EdNet
圣诞老人收集的各种学生活动的大规模分层数据集,一个配备人工智能辅导系统的多平台自学解决方案。 EdNet 包含 2 年多来收集的 784,309 名学生的 131,441,538 次互动,这是迄今为止向公众发布的 ITS 数据集中最大的。资料来源:EdNet:教育中的大规模分层数据集
OpenDataLab 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录