blind-review-data/StarCraftMotion_sample

Name: blind-review-data/StarCraftMotion_sample
Creator: blind-review-data
Published: 2026-04-30 19:56:26
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/blind-review-data/StarCraftMotion_sample

下载链接

链接失效反馈

官方服务：

资源简介：

StarCraftMotion是一个大规模的多智能体模拟基准数据集，基于《星际争霸》游戏回放构建，专注于对抗性和部分可观测场景下的智能体行为模拟。每个数据样本是一个固定长度的场景窗口（145帧，16 FPS，约9秒），包含所有单位状态、动态地图层和每玩家经济时间序列。数据集特别强调交互密集的窗口，用于测试部分可观测条件下的多智能体预测能力。数据集包含469,187个场景，分为训练、验证和测试集，覆盖多种地图和种族对战组合。数据以parquet格式存储，包含丰富的单位和地图信息，适用于多智能体模拟、战争迷雾处理和交互场景预测等研究。

StarCraftMotion is a large-scale benchmark for agent simulation under adversarial and partial observability scenarios, built from StarCraft replays. Each example is a fixed-length scenario window (145 frames at 16 FPS, ~9 seconds) containing all unit states, dynamic map layers, and per-player economy time series. The dataset is adversarially subsampled to overweight interaction-heavy windows, making it a stress test for multi-agent prediction under partial observability. It includes 469,187 scenarios split into training, validation, and test sets, covering various maps and race matchups. The data is stored in parquet format with detailed unit and map information, suitable for research in multi-agent simulation, fog-of-war handling, and interaction-heavy scene prediction.

提供机构：

blind-review-data

搜集汇总

数据集介绍

构建方式

StarCraftMotion_sample数据集的构建源于对StarCraft II对战回放文件的深度挖掘与结构化处理。首先，通过三次引擎级解析（全局视角与双方战争迷雾视角），将原始回放转化为HDF5格式，完整保存单位本初坐标、引擎指令标识与逐方可见性信息。随后，以16帧/秒的速率截取145帧（约9秒）的场景窗口，并剔除时长不足120秒或任意方APM低于1的回放，以确保数据质量。基于回放级别划分训练、验证与测试集（80/10/10），并特别引入对抗性权重采样策略，依据单位互见数量与交互转换频次的对数加权，过度保留高对抗性窗口，从而构建出聚焦于部分可观测条件下多智能体预测的挑战性基准。

特点

该数据集的核心特色在于其大规模、高对抗性与部分可观测性，是评估多智能体仿真模型的严苛试金石。总计包含469,187个场景，涵盖六大种族对阵组合，并引入两张分布外地图（Catallena_LE与Odyssey_LE）以测试模型泛化能力。每个场景记录145帧内所有单位的坐标、生命值、朝向、指令等时序状态，以及地图菌毯、战争迷雾等动态图层的稀疏快照，同时提供双方经济时序数据。其对抗性权重机制确保数据集侧重于交互密集的片段，突出互见性与玩家转换事件，从而对模型的预测鲁棒性与不确定性推理提出更高要求。

使用方法

数据集以Parquet格式存储，每个样本对应一个完整场景。通过HuggingFace Datasets库的load_dataset函数即可加载，支持流式读取以处理大规模数据。时序数组以Arrow的large_list格式存储，读取后需根据n_timesteps（145）与n_units（每场景不等）进行维度重塑，例如坐标数据reshape为(145, N, 3)。对于动作预测任务，提供从原始SC2能力ID到11类粗粒度动作的映射表，可通过构建查找表进行矢量化转换。数据可直接用于多智能体轨迹预测、战争迷雾推理及跨地图泛化性能的基准测试，亦支持基于部分可观测性的对抗性仿真研究。

背景与挑战

背景概述

StarCraftMotion是一个大规模基准数据集，由研究人员基于暴雪娱乐的《星际争霸II》3.16.1版本回放包构建，旨在推动多智能体模拟在对抗性与部分可观测场景下的研究。该数据集于近期发布，包含约469,187个固定时长（145帧，约9秒）的场景窗口，覆盖5张地图（包括2张分布外测试地图），并采用回放级别划分。其核心研究问题聚焦于在战争迷雾、单位交互密集等复杂条件下，对多智能体轨迹与行为进行精准预测。凭借海量标注数据（如单位坐标、行动标签、视野状态等），StarCraftMotion为时间序列预测、部分可观测环境下的智能体模拟等领域提供了标准化评测平台，对强化学习与多智能体系统的研究具有重要推动作用。

当前挑战

该数据集所解决的领域问题主要包括：在部分可观测且对抗性极强的实时策略游戏环境中，多智能体系统的轨迹与动作预测面临高度不确定性与指数级组合的挑战；同时，构建过程中需克服以下难点：一是从64,327个回放文件中高效提取单位状态与动态地图层，并处理引擎版本差异；二是设计对抗性采样权重（基于互视单位数与状态转移计数），以重点捕捉交互密集场景，剔除窗口零得分样本；三是确保回放级别数据划分的严格隔离，避免信息泄露，并保留地图分布外泛化能力，从而为模型鲁棒性评估提供严苛基准。

常用场景

经典使用场景

在智能体仿真与多智能体系统研究领域，StarCraftMotion数据集被广泛应用于对抗性部分可观测场景下的多智能体轨迹预测与行为建模。该数据集从《星际争霸II》的469,187个对战回放片段中提取，每个样本包含145帧（约9秒）的完整单位状态、动态地图层及双玩家经济时间序列。研究者利用这些高保真度数据，能够训练模型在复杂战争迷雾与对抗环境下，精准预测单位运动轨迹、协同行动模式以及资源调度策略，从而为多智能体系统的实时决策与协调提供极具挑战性的标准化测试平台。

解决学术问题

该数据集的核心学术价值在于突破了传统多智能体仿真数据集的两个瓶颈：一是真实对抗环境中的部分可观测性，二是高密度交互场景的覆盖。通过独特的对抗性加权采样策略（优化单位相互可见性与交互转换频次），StarCraftMotion促使学术界深入探究在信息不完全条件下智能体如何完成态势感知、意图推断与协作规划。这一基准推动了部分可观测马尔可夫决策过程（POMDP）框架下的多智能体强化学习研究，使模型在应对战场迷雾、单位真伪识别及突发战术变化时的鲁棒性评估成为可能，显著提升了智能体在复杂动态环境中的泛化能力与决策质量。

衍生相关工作

基于StarCraftMotion数据集，学术界已涌现一系列标志性工作。在轨迹预测方向，研究者提出了利用时空图注意力网络（ST-GAT）融合单位类型与可见性特征，实现了对部分观测条件下多智能体未来轨迹的精准推断。动作预测领域，基于该数据集的11类粗粒度动作映射体系，衍生出多任务学习范式下同时进行动作类别识别与目标定位的联合模型。另有工作聚焦于地图外泛化能力，利用域对抗训练技术消除比赛地图差异带来的分布偏移，显著提升了模型在未见地图上的预测保真度。这些衍生研究共同构成了从数据表征到算法验证的完整生态链条。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集