five

CounterStrike_Deathmatch|游戏AI数据集|行为克隆数据集

收藏
huggingface2024-10-29 更新2024-12-12 收录
游戏AI
行为克隆
下载链接:
https://huggingface.co/datasets/TeaPearce/CounterStrike_Deathmatch
下载链接
链接失效反馈
资源简介:
该数据集用于Counter-Strike游戏中的行为克隆研究,包含多个子集,涵盖不同地图和游戏模式,数据格式为.hdf5和.npy,分别包含游戏截图和处理后的动作标签以及抓取的元数据。
创建时间:
2024-10-22
原始信息汇总

Counter-Strike Deathmatch 数据集概述

数据集来源

  • 数据集由 Tim Pearce 和 Jun Zhu 在 IEEE Conference on Games (CoG) 2022 上发表的论文《Counter-Strike Deathmatch with Large-Scale Behavioural Cloning》中提出。
  • 论文链接:https://arxiv.org/abs/2104.04258
  • CoG 论文链接:https://ieee-cog.org/2022/assets/papers/paper_45.pdf

数据集组成

数据集包含多个子集,具体如下:

主要数据集

  • 文件名: hdf5_dm_july2021_*_to_*.tar
    • 文件数量: 5500
    • 总大小: 700 GB
    • 地图: dust2
    • 游戏模式: deathmatch
    • 来源: 从在线服务器抓取

专家数据集

  • 文件名: dataset_dm_expert_dust2/hdf5_dm_july2021_expert_*.hdf5

    • 文件数量: 190
    • 总大小: 24 GB
    • 地图: dust2
    • 游戏模式: deathmatch
    • 来源: 手动创建,清洁动作
  • 文件名: dataset_aim_expert/hdf5_aim_july2021_expert_*.hdf5

    • 文件数量: 45
    • 总大小: 6 GB
    • 地图: aim map
    • 游戏模式: aim mode
    • 来源: 手动创建,清洁动作
  • 文件名: dataset_dm_expert_othermaps/hdf5_dm_nuke_expert_*.hdf5

    • 文件数量: 10
    • 总大小: 1 GB
    • 地图: nuke
    • 游戏模式: deathmatch
    • 来源: 手动创建,清洁动作
  • 文件名: dataset_dm_expert_othermaps/hdf5_dm_mirage_expert_*.hdf5

    • 文件数量: 10
    • 总大小: 1 GB
    • 地图: mirage
    • 游戏模式: deathmatch
    • 来源: 手动创建,清洁动作
  • 文件名: dataset_dm_expert_othermaps/hdf5_dm_inferno_expert_*.hdf5

    • 文件数量: 10
    • 总大小: 1 GB
    • 地图: mirage
    • 游戏模式: deathmatch
    • 来源: 手动创建,清洁动作

元数据

  • 文件名: dataset_metadata/currvarsv2_dm_july2021_*_to_*.npy, currvarsv2_dm_july2021_expert_*_to_*.npy, currvarsv2_dm_mirage_expert_1_to_100.npy, currvarsv2_dm_inferno_expert_1_to_100.npy, currvarsv2_dm_nuke_expert_1_to_100.npy, currvarsv2_aim_july2021_expert_1_to_100.npy
    • 文件数量: 61
    • 总大小: 6 GB
    • 地图: 根据文件名
    • 游戏模式: 根据文件名
    • 来源: 根据文件名

位置追踪备份

  • 文件名: location_trackings_backup/
    • 文件数量: 305
    • 总大小: 0.5 GB
    • 地图: dust2
    • 游戏模式: deathmatch
    • 来源: 包含用于计算地图覆盖分析的元数据

数据文件结构

.hdf5 文件结构

  • 内容: 包含1000帧(约1分钟)的游戏画面和处理后的动作标签。
  • 格式: .hdf5 格式,便于快速数据加载。
  • 键值:
    • frame_i_x: 图像
    • frame_i_xaux: 包含前一时间步的动作、生命值、弹药和队伍信息。
    • frame_i_y: 包含目标动作的扁平化向量形式。
    • frame_i_helperarr: 包含击杀和死亡标志的二进制变量。

.npy 文件结构

  • 内容: 包含与100个.hdf5文件对应的元数据。
  • 格式: .npy 格式。
  • 键值:
    • file_numi_frame_j: 文件编号和帧编号。
    • curr_vars: 包含原始抓取的元数据。
    • infer_a: 推断的动作,包含按键、鼠标位置和点击信息。
    • frame_i_helperarr: 重复.hdf5文件中的信息。

训练模型

  • 模型: 提供四个训练模型,包括“非状态”和“状态”版本。
  • 文件名: trained_models.zip
    • ak47_sub_55k_drop_d4: 仅在AK47序列上预训练。
    • ak47_sub_55k_drop_d4_dmexpert_28: 在专家死亡竞赛数据上微调。
    • ak47_sub_55k_drop_d4_aimexpertv2_60: 在aim模式专家数据上微调。
    • July_remoterun7_g9_4k_n32_recipe_ton96__e14: 在整个数据集上预训练。

其他使用该数据集的工作

  • Imitating Human Behaviour with Diffusion Models, ICLR 2023: https://arxiv.org/abs/2301.10677
  • Diffusion for World Modeling: Visual Details Matter in Atari, NeurIPS 2024: https://arxiv.org/pdf/2405.12399
AI搜集汇总
数据集介绍
main_image_url
构建方式
CounterStrike_Deathmatch数据集通过从在线服务器抓取和手动创建两种方式构建。在线服务器抓取的数据集包含5500个.hdf5文件,总计约700GB,主要来自dust2地图的死亡竞赛模式。手动创建的数据集则包括专家玩家的干净动作数据,分为dust2、aim map、nuke、mirage和inferno等多个地图,总计约33GB。所有数据均以.hdf5格式存储,便于快速加载和访问。
特点
该数据集包含视频、动作标签和元数据,适用于模仿学习、行为克隆、世界建模和视频生成等任务。数据集的特点在于其大规模性和多样性,涵盖了不同地图和游戏模式,且提供了专家玩家的高质量动作数据。此外,数据集还包含丰富的元数据,如玩家健康值、弹药量和团队信息,为研究提供了多维度的分析基础。
使用方法
使用CounterStrike_Deathmatch数据集时,研究者可以通过加载.hdf5文件获取视频帧和动作标签。每个.hdf5文件包含1000帧(约1分钟)的游戏画面,支持按需访问部分帧数据。研究者可以利用这些数据进行模型训练和测试,特别是在模仿学习和行为克隆任务中。此外,数据集提供的元数据可用于深入分析玩家行为和游戏策略。
背景与挑战
背景概述
CounterStrike_Deathmatch数据集由Tim Pearce和Jun Zhu于2022年发布,旨在为行为克隆、模仿学习、世界建模和视频生成等研究领域提供高质量的游戏数据。该数据集基于广受欢迎的第一人称射击游戏《反恐精英:全球攻势》(CS:GO),包含了大量的视频帧、动作标签和元数据。数据集的核心研究问题在于如何通过大规模的行为数据训练智能体,使其能够在复杂的游戏环境中表现出与人类玩家相似的行为。该数据集在IEEE Conference on Games (CoG) 2022上获得了最佳论文奖,并在相关领域的研究中产生了广泛影响。
当前挑战
CounterStrike_Deathmatch数据集在构建和应用过程中面临多重挑战。首先,数据集的构建需要从在线服务器中抓取大量游戏数据,并确保数据的多样性和代表性,这涉及到复杂的数据清洗和预处理工作。其次,由于游戏环境的动态性和复杂性,如何准确地标注动作标签并保持数据的一致性成为一大难题。此外,数据集的应用场景如行为克隆和模仿学习,要求模型能够从高维度的视频帧和动作序列中提取有效特征,这对模型的训练和优化提出了更高的要求。最后,数据集的规模庞大,存储和计算资源的消耗也成为实际应用中的瓶颈。
常用场景
经典使用场景
CounterStrike_Deathmatch数据集在模仿学习和行为克隆领域展现了其经典应用场景。通过捕捉《反恐精英:全球攻势》游戏中的视频、动作标签和元数据,研究人员能够构建复杂的模型来模拟玩家的行为模式。这些模型不仅能够精确复制高手的操作,还能在虚拟环境中进行自我优化,从而提升游戏AI的智能水平。
衍生相关工作
基于CounterStrike_Deathmatch数据集,多项经典研究工作得以展开。例如,ICLR 2023的论文《Imitating Human Behaviour with Diffusion Models》利用该数据集探索了扩散模型在模仿人类行为中的应用。此外,NeurIPS 2024的论文《Diffusion for World Modeling: Visual Details Matter in Atari》进一步扩展了该数据集在世界建模中的应用,展示了视觉细节在游戏AI中的重要性。
数据集最近研究
最新研究方向
近年来,CounterStrike_Deathmatch数据集在行为克隆和模仿学习领域展现了显著的研究价值。该数据集通过捕捉《反恐精英:全球攻势》(CS:GO)游戏中的视频、动作标签和元数据,为研究者提供了丰富的实验素材。特别是在大规模行为克隆方面,该数据集的应用推动了智能体在复杂环境中的决策能力提升。近期研究进一步探索了扩散模型在模仿人类行为中的应用,如ICLR 2023发表的论文《Imitating Human Behaviour with Diffusion Models》,展示了如何利用扩散模型生成逼真的游戏行为。此外,NeurIPS 2024的研究《Diffusion for World Modeling: Visual Details Matter in Atari》则强调了视觉细节在世界建模中的重要性,进一步拓展了该数据集在生成模型领域的应用前景。这些研究不仅验证了数据集的有效性,也为未来在游戏AI、强化学习和生成模型等领域的研究提供了新的思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录

中国区域教育数据库

该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。

www.moe.gov.cn 收录

Titanic Dataset

Titanic Data Analysis: A Journey into Passenger Profiles and Survival Dynamics

kaggle 收录

EdNet

圣诞老人收集的各种学生活动的大规模分层数据集,一个配备人工智能辅导系统的多平台自学解决方案。 EdNet 包含 2 年多来收集的 784,309 名学生的 131,441,538 次互动,这是迄今为止向公众发布的 ITS 数据集中最大的。资料来源:EdNet:教育中的大规模分层数据集

OpenDataLab 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录