five

CounterQuant-CS2-Demos

收藏
Hugging Face2026-05-19 更新2026-05-20 收录
下载链接:
https://huggingface.co/datasets/KEDevO/CounterQuant-CS2-Demos
下载链接
链接失效反馈
官方服务:
资源简介:
CounterQuant-CS2-Demos是一个专业数据集,包含官方《反恐精英 2》(CS2)Tier 1级别比赛的演示文件。数据来源于HLTV演示档案,以原始的.dem文件格式提供,并按年份、比赛ID和具体地图进行组织,存储路径为data/{year}/{match_id}/{map}.dem。数据集规模庞大,超过1TB,适用于电子竞技分析、游戏战术研究、玩家行为建模等任务。用户可以使用demoparser2或awpy等工具对演示文件进行解析和处理。该数据集采用CC-BY-NC-4.0许可证,仅限研究和非商业用途。

CounterQuant-CS2-Demos is a professional dataset containing official Counter-Strike 2 (CS2) Tier 1 match demo files. The data is sourced from HLTV demo archives, provided in the original .dem file format, and organized by year, match ID, and specific map, with storage paths as data/{year}/{match_id}/{map}.dem. The dataset is large-scale, exceeding 1TB, and is suitable for tasks such as esports analysis, game tactics research, and player behavior modeling. Users can parse and process the demo files using tools like demoparser2 or awpy. The dataset is licensed under CC-BY-NC-4.0, for research and non-commercial use only.
创建时间:
2026-05-19
原始信息汇总

CounterQuant CS2 Demos 数据集概述

基本信息

  • 数据集名称:CounterQuant CS2 Demos
  • 许可证:CC BY 4.0
  • 语言:英语
  • 数据集规模:10K < n < 100K(约1万至10万个文件)
  • 任务类别:其他
  • 标签:CS2、反恐精英、电子竞技、演示、博弈论、体育分析

数据集目标

为CS2研究社区提供最大的开放获取专业级演示文件集合,涵盖从CS:GO起源到CS2现今的所有竞技级别。目标是汇集所有可用的演示文件,供任何人以任意方式进行预处理、解析或特征提取,无任何限制。

数据覆盖范围

层级 描述 年份 状态
T1 Major/S级赛事(世界前20战队) 2024–至今 每日更新
T2 A级赛事(世界前50战队) 2024–至今 每日更新
T3 B级/区域赛事 2024–至今 进行中
历史数据 CS:GO T1/T2(2024年之前) 2012–2023 计划中

文件结构

数据以原始CS2演示文件(.dem)形式存储,目录结构如下:

data/{年份}/tier{层级}/{比赛ID}/{地图名}.dem

例如:data/2024/tier1/2378549/astralis-vs-natus-vincere-mirage.dem

数据来源

演示文件来源于 HLTV.org —— 专业CS2比赛数据的官方仓库,也是所有竞技CS2/CS:GO结果和回放的权威来源。

更新计划

新演示文件在比赛完成后24-48小时内添加,管道在专用VPS基础设施上持续运行。

使用方式

解析演示文件(Python)

python from demoparser2 import DemoParser parser = DemoParser("data/2024/tier1/2378549/astralis-vs-natus-vincere.dem") kills = parser.parse_event("player_death", player=["name", "team_name"]) rounds = parser.parse_ticks(["total_rounds_played", "cash_spent_t", "cash_spent_ct"])

通过 Hugging Face Hub 下载

python from huggingface_hub import snapshot_download path = snapshot_download( repo_id="KEDevO/CounterQuant-CS2-Demos", repo_type="dataset", allow_patterns="data/2024/tier1/**", local_dir="./demos", )

流式下载单个文件

python from huggingface_hub import hf_hub_download dem = hf_hub_download( repo_id="KEDevO/CounterQuant-CS2-Demos", repo_type="dataset", filename="data/2024/tier1/2378549/match.dem", )

应用场景

  • 特征工程:提取回合经济、定位、道具使用、选手评分
  • 模型训练:胜率预测、选手评分、战队强度模型
  • 研究分析:CS2博弈论、战术分析、团队动力学
  • 统计计算:自行计算KDA、HLTV Rating 2.0、ADR、Impact
  • 无限制使用:原始字节数据,可按任意方式解析

相关资源

引用信息

bibtex @dataset{kulbe2025counterquant, author = {Eimantas Kulbe}, title = {CounterQuant CS2 Demos}, year = {2026}, publisher = {HuggingFace}, url = {https://huggingface.co/datasets/KEDevO/CounterQuant-CS2-Demos}, note = {Continuously updated professional CS2 demo dataset, all tiers, T1/T2/T3} }

搜集汇总
数据集介绍
main_image_url
构建方式
CounterQuant-CS2-Demos数据集由Eimantas Kulbe基于CounterQuant电竞分析项目精心构建,旨在为CS2研究社区提供最大规模的开源专业比赛录像文件集合。该数据集从权威的HLTV平台系统性地采集原始CS2演示文件(.dem格式),覆盖从CS:GO起源时代延续至今的各级别职业赛事,包括T1(顶级世界前20战队参与的Major/S级赛事)、T2(前50战队参与的A级赛事)以及T3(B级/区域级赛事)。数据集采用按年份、赛事层级与比赛ID组织的层级化文件结构,例如data/2024/tier1/{match_id}/{map_name}.dem,便于研究者按需定位与提取特定比赛的完整对局回放。
特点
该数据集以“无预处理锁定、无访问限制”为核心哲学,提供最原始的二进制演示文件,充分释放研究者的特征工程自由度。其显著特点在于规模庞大与覆盖全面,当前活跃收录2024年至今的T1与T2赛事数据并每日更新,同时规划回溯2012至2023年的历史CS:GO顶级赛事,致力于成为CS2领域最完整的原始对战数据仓库。数据来源HLTV作为职业CS2比赛回放的官方权威存储库,保证了数据源的可靠性与竞技级别的纯正性。研究者可依据自身需求,自由提取回合经济、选手位置、投掷物使用、选手评分等任意维度的特征,不受限于任何预设的预处理范式。
使用方法
数据集的使用灵活多样,支持多种解析与获取方式。研究者可借助Python生态中的demoparser2库对本地演示文件进行高效解析,例如通过DemoParser类读取玩家击杀事件或逐回合经济数据,为构建胜率预测模型、选手评级系统或团队战术分析等任务提供原始数据支撑。数据下载可通过huggingface_hub库实现,使用snapshot_download函数按通配模式批量下载特定年份与层级的所有演示文件至本地目录,或利用hf_hub_download函数流式获取单个比赛文件,满足不同场景下的定制化数据获取需求。
背景与挑战
背景概述
电子竞技已成为全球瞩目的数字体育领域,其中《反恐精英2》(Counter-Strike 2, CS2)作为经久不衰的战术射击游戏,其竞技数据蕴含丰富的博弈策略与团队动态研究价值。由研究者Eimantas Kulbe主导、隶属于CounterQuant电竞分析项目的数据集CounterQuant-CS2-Demos于2026年正式发布,旨在为学术界与产业界提供迄今最大规模的开源职业比赛原始回放文件(.dem格式)集合。该数据集系统收录了自CS:GO时代至今、覆盖T1至T3各级别赛事的对战记录,并保持每日更新,为游戏理论分析、战术建模及胜率预测等研究提供了前所未有的数据基础。其开放性设计摒弃了预处理锁定,允许研究者自由解析特征,对推动电竞数据科学标准化与可复现性具有里程碑意义。
当前挑战
该数据集所解决的领域核心挑战在于,当前CS2专业回放数据长期分散于各赛事平台且缺乏统一标准,导致跨赛事的经济模型、团队协同与动态博弈等微观分析难以系统性开展。CounterQuant-CS2-Demos通过整合HLTV权威来源并开放原始二进制文件,破解了数据碎片化与访问壁垒难题,使研究人员能够直接解析回合经济、投掷物布局及位置轨迹等细粒度特征。在构建过程中,团队面临三大挑战:一是海量实时比赛回放的高频采集与持续更新,需依赖专用VPS基础设施在24至48小时内完成处理;二是历史CS:GO数据(2012–2023)的存量浩繁且格式兼容性问题,需规划性的分阶段导入;三是确保数据来源的合法性与可溯源性,需与HLTV官方保持稳定合作以避免版权争议。
常用场景
经典使用场景
在电子竞技科学与游戏分析研究领域,CounterQuant-CS2-Demos数据集作为目前规模最大的开放获取型CS2职业赛事原始对局录像库,其经典使用场景集中于多维度战术特征提取与竞技表现建模。研究者可借助该数据集解析顶级战队的攻防经济分配、投掷物使用模式与动态站位演化,进而构建用于预测地图胜率或选手实时Rating的统计模型。其原始二进制格式保留了比赛的全部时空信息,为从底层探索游戏博弈论机制提供了无偏倚的数据基础。
解决学术问题
该数据集精准回应了电子竞技研究中长期存在的数据孤岛与预处理偏见问题。过往研究往往依赖网站在线统计或非标准化解析文件,导致实验难以复现且结论缺乏普适性。CounterQuant-CS2-Demos通过开放全部层次(T1至T3)与历史赛事的原始DEM文件,使学界能够系统性地量化选手决策效率、团队协作熵值以及经济系统的长期均衡特性。这一资源显著推动了竞争对抗环境下人类行为建模理论的实证验证,也填补了从CS:GO到CS2时代过渡中赛事数据非连续性的研究空白。
衍生相关工作
该数据集业已催生出一系列富有影响力的衍生研究与开发工作。其核心的原始DEM文件结构与解析主张启发了CounterQuant-Bronze结构化摘要数据集,将非结构化录像转化为可直接用于机器学习的赛事级、选手级与团队级特征表(JSON/Parquet格式)。此外,以该数据为训练来源的在线分析平台CounterQuant已实现了对实时比赛的经济波动与选手Impact Rating的动态可视化计算。学术界也涌现出基于此数据集的战术聚类分析与赛场位置预测等前沿探索,进一步强化了其作为电子竞技量化研究基准资源的重要地位。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作