blind-review-data/StarCraftMotion

Name: blind-review-data/StarCraftMotion
Creator: blind-review-data
Published: 2026-04-30 19:21:58
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/blind-review-data/StarCraftMotion

下载链接

链接失效反馈

官方服务：

资源简介：

StarCraftMotion是一个基于《星际争霸》回放构建的大规模基准数据集，用于在对抗性和部分可观测场景下的智能体模拟。每个样本是一个固定长度的场景窗口（145帧，16 FPS，约9秒），包含所有单位状态、动态地图层和每玩家经济时间序列。数据集特别强调交互密集的窗口，以测试多智能体在部分可观测性下的预测能力。数据集包含469,187个场景，分为训练、验证和测试集，分别有362,075、45,121和61,991个场景。数据来源于64,327个回放文件，覆盖多个地图，并提供了详细的数据模式和读取方法。

StarCraftMotion is a large-scale benchmark for agent simulation under adversarial and partial observability scenarios, built from StarCraft replays. Each example is a fixed-length scenario window (145 frames at 16 FPS, ~9 seconds) containing all unit states, dynamic map layers, and per-player economy time series. The dataset is adversarially split to overweight interaction-heavy windows, making it a stress test for multi-agent prediction under partial observability. It includes 469,187 scenarios, split into 362,075 training, 45,121 validation, and 61,991 test examples. The data is sourced from 64,327 replay files and covers multiple maps. The README provides a detailed schema, instructions for reading the data, and intended use cases.

提供机构：

blind-review-data

搜集汇总

数据集介绍

构建方式

StarCraftMotion数据集基于Blizzard官方发布的《星际争霸II》3.16.1版本对战录像构建而成。首先通过三遍引擎处理（全知视角与双方战争迷雾视角）将原始录像提取为HDF5文件，保留原生坐标、原始单位与技能ID以及逐玩家可见性信息。随后将录像切分为145帧（约9秒）的固定长度场景窗口，并剔除时长不足120秒或双方APM均低于1的对局。采用对抗性加权采样策略，以交互密集窗口（基于单位互见与合作者过渡次数）为目标进行过采样。最终按80/10/10比例划分训练、验证与测试集，并将未见地图独立划入测试集，确保同一录像的窗口不跨集合。

特点

该数据集的核心特点在于其对抗性与部分可观测性设计。每个样本包含145帧连续时序数据，涵盖所有单位状态、动态地图图层及玩家经济序列。单位状态包括坐标、朝向、生命值、护盾、能量等属性，地图图层提供菌毯与双方战争迷雾信息。特别引入了单位可见性状态编码，将每个单位对两名玩家的可视性合并为一个值，便于研究部分可观测环境下的多智能体预测。数据集收录了5张训练地图和2张测试专用未见地图，覆盖PvP、PvT、PvZ等6种种族对抗组合，总场景数达469,187个，单位数量从11至921不等，具有丰富的交互复杂度。

使用方法

数据集以Parquet格式存储，可通过HuggingFace Datasets库直接加载。每行数据代表一个场景，包含标量字段（如场景ID、地图名、帧数、单位数）和数组字段（如坐标、存活状态、单位所属、单位类型、地图图层）。用户可使用NumPy将数组字段重塑为指定形状，如将坐标数据从一维数组重塑为(T, N, 3)的三维张量。动作标签方面，数据集提供原始SC2技能ID，并附赠11类粗粒度动作映射脚本，涵盖无操作、移动、攻击、采集、训练、建造等类别，便于进行多智能体行为预测任务。数据集支持流式加载，适合大规模实验。

背景与挑战

背景概述

StarCraftMotion数据集由研究团队基于暴雪娱乐发布的《星际争霸II》3.16.1版本回放包构建，于近年推出，旨在为多智能体仿真领域提供一个在对抗性与部分可观测性场景下的大规模基准测试。该数据集涵盖469,187个固定长度场景窗口，每个窗口包含145帧（约9秒）的单位状态、动态地图层及玩家经济时间序列，其核心研究问题聚焦于多智能体在迷雾战争（fog-of-war）和交互密集条件下的预测与泛化能力。通过引入对抗性采样策略，数据集中交互密集窗口被过度加权，从而对模型在部分可观测环境中的鲁棒性提出严峻挑战。作为首个基于真实《星际争霸II》对战回放构建的大规模部分可观测多智能体仿真基准，StarCraftMotion对推动智能体在复杂对抗环境下的轨迹预测、动作推断及地图泛化研究具有重要影响力。

当前挑战

StarCraftMotion数据集致力于解决多智能体仿真在部分可观测和对抗性环境中的核心难题：智能体需在不完全信息条件下，从历史帧中推断敌方单位状态与意图，并预测未来轨迹。由于玩家视野受限，模型必须处理来自迷雾的遮挡信息、单位间的交互依赖以及对抗性策略的动态变化，这对传统序列预测方法的鲁棒性构成严峻挑战。在构建过程中，团队面临多重技术难点：从64,327个原始回放中提取高质量交互窗口时，需设计对抗性加权采样策略以过滤低交互场景，同时确保跨回放的分割不导致数据泄露；此外，对于地图不同的空间维度（如Abyssal_Reef_LE为176×200网格），需在统一的Parquet格式中存储可变长度的矩阵数据，并保持脚本地图之间的泛化能力。最终，数据集通过提供原始能力ID到粗粒度动作映射（11类），为后续研究者在统一基准下评估模型对抗性部分可观测场景的预测及泛化能力奠定了坚实基础。

常用场景

经典使用场景

StarCraftMotion数据集专为多智能体系统在对抗性与部分可观测环境下的运动与行为预测而设计。其核心使用场景聚焦于从星海争霸II的完整对局录像中，提取出密集交互的固定时长片段（约9秒，145帧），用于训练和评估能够感知战争迷雾、单位状态及动态地图图层（如菌毯、视野）的预测模型。研究者常利用该数据集构建端到端的智能体仿真系统，其中每个样本包含所有单位的轨迹、生命值、能量、指令类型等细粒度时序信息，以及双玩家的经济序列。该设定尤其适合检验模型在不完全信息条件下，对敌方单位意图与未来位置的推断能力。

衍生相关工作

围绕StarCraftMotion数据集，学术界已衍生出一系列标志性工作。部分研究聚焦于利用其时序图结构，提出融合动态注意力机制的Transformer模型，在长期依赖建模上超越传统LSTM基线。另一些工作则引入对比学习框架，利用战争迷雾下的可见与不可见序列对，预训练具有常识推理能力的感知编码器。在仿真评估方面，基于该数据集的基准测试催生了如隐式马尔可夫交互模型（IMI）和图神经网络状态预测器（GNSP）等经典架构，这些模型在星际争霸之外的多人博弈任务中同样表现优异，充分彰显了该数据集作为多智能体仿真研究“试金石”的重要地位。

数据集最近研究