RedDwarfData

Name: RedDwarfData
Creator: 格拉纳达大学
Published: 2017-12-29 19:06:16
License: 暂无描述

arXiv2017-12-29 更新2024-06-21 收录

下载链接：

https://github.com/analca3/StarCraft-winner-prediction

下载链接

链接失效反馈

官方服务：

资源简介：

RedDwarfData是由格拉纳达大学等机构创建的一个简化版星际争霸比赛数据集，包含4655场比赛数据。该数据集从Robinson和Watson发布的比赛数据中提取，经过处理以帧的形式存储，便于进行时间序列研究。数据集内容包括比赛时长、玩家标识、资源变化等关键信息，创建过程中特别关注了数据的时间参考和资源变化的记录。RedDwarfData适用于机器学习和计算智能技术的测试，特别是在AI算法训练和策略分析方面，旨在解决星际争霸比赛中AI决策和策略优化的问题。

RedDwarfData is a simplified StarCraft match dataset created by the University of Granada and other institutions, containing 4655 match records. Extracted from the match datasets released by Robinson and Watson, this dataset has been processed and stored in frame format to facilitate time-series research. The dataset includes key information such as match duration, player identifiers, resource changes and other critical details, with special attention paid to the recording of temporal references and resource variation during its creation. RedDwarfData is suitable for testing machine learning and computational intelligence technologies, especially for AI algorithm training and strategy analysis, aiming to address the issues of AI decision-making and strategy optimization in StarCraft matches.

提供机构：

格拉纳达大学

创建时间：

2017-12-29

搜集汇总

数据集介绍

构建方式

在实时策略游戏研究领域，数据集的构建往往面临原始数据庞大且处理复杂的挑战。RedDwarfData的构建基于Robertson和Watson发布的原始比赛数据库，通过精心设计的提取与过滤流程，将复杂的游戏日志转化为易于使用的结构化数据。具体而言，该数据集以资源变化时刻作为时间参考点，而非固定帧间隔采样，从而捕捉游戏动态演变的关键节点。对于每个比赛，系统记录双方玩家的资源（矿物、气体、补给）变动，并通过累加区域单位价值估算双方军力，同时填补缺失值以确保数据完整性。最终，数据以CSV格式保存，涵盖比赛ID、胜者及持续时间等核心信息，形成包含4655场不同种族对抗的简化数据集。

特点

RedDwarfData的显著特点在于其轻量化和平衡性，为教学与小规模算法验证提供了便捷工具。数据集规模适中，避免了动辄数百GB的存储负担，同时确保在比赛时长、种族组合及资源使用上分布均衡。宏观分析显示，比赛时长多集中于20至25分钟，且不同种族对抗的组合覆盖全面，其中虫族在胜率上略显优势。数据以CSV格式存储，无需专用解析工具，可直接被多种编程语言读取，极大降低了使用门槛。此外，数据集基于自由许可证公开于GitHub，支持研究者快速开展比赛结果预测、策略分析或智能体训练等任务。

使用方法

该数据集适用于实时策略游戏人工智能的多种研究场景，包括胜率预测、种族策略分析与智能体优化。使用者可直接从GitHub下载CSV文件，利用常见的数据处理库（如Python的pandas）加载数据，无需额外转换步骤。每行数据代表特定资源变化时刻的游戏状态，包含双方资源、估算军力及比赛元数据，便于构建时间序列模型或静态分类器。研究者可基于这些特征训练机器学习模型，探索早期胜者预测或种族对抗模式；亦可结合进化算法，开发高效游戏智能体。数据集的简洁结构支持快速实验迭代，为学术教学与原型开发提供了理想基准。

背景与挑战

背景概述

在实时策略游戏人工智能研究领域，《星际争霸》因其复杂的决策环境和动态对抗特性，成为验证机器学习与计算智能算法的理想平台。RedDwarfData数据集由西班牙格拉纳达大学等机构的研究团队于2017年12月发布，旨在解决原始游戏日志处理繁琐、数据提取耗时且易引入偏差的问题。该数据集基于Robertson与Watson先前发布的比赛记录，通过帧级处理整合了数千场对局信息，涵盖不同种族、资源与时长分布的平衡样本，为时序分析与智能体训练提供了轻量化的结构化数据基础，显著降低了相关领域的研究门槛。

当前挑战

RedDwarfData所针对的核心挑战在于实时策略游戏中的胜率预测与策略建模，其难点包括游戏状态的高维动态表征、长短时决策的耦合影响以及多种族平衡性下的模式泛化。在数据集构建过程中，研究者需克服原始日志的异构性与不完整性，通过以资源变化为基准的帧采样方法统一时序对齐，同时处理大量空值并估算敌方单位数据，确保特征提取的一致性与可靠性。此外，如何在保持数据规模可控的前提下，实现种族、时长与资源分布的均衡性，亦是该数据集构建中的关键挑战。

常用场景

经典使用场景

在实时策略游戏人工智能研究领域，RedDwarfData数据集常被用于构建和验证游戏胜负预测模型。该数据集通过提取《星际争霸》对局中资源变化的关键帧数据，为研究者提供了时序分析的基础。这种处理方式使得机器学习算法能够捕捉游戏动态演变过程，进而识别影响战局走向的核心因素。

实际应用

在实际应用层面，RedDwarfData为游戏人工智能开发提供了训练基础。基于该数据集构建的预测模型可被集成至游戏机器人系统中，用于实时评估对战态势并调整策略。这种技术不仅能够提升游戏机器人的竞技水平，其决策框架也可迁移至军事模拟、资源调度等需要动态规划的现实场景。

衍生相关工作

该数据集已衍生出多项经典研究工作，例如Álvarez-Caballero等人利用其实现了对局早期胜负预测，为进化算法优化游戏机器人提供了快速评估环境。此外，该数据集的轻量化特性也使其成为教学演示和算法原型开发的理想选择，推动了实时策略游戏人工智能在教育与科研领域的普及。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集