stratego
收藏Hugging Face2025-12-01 更新2025-12-02 收录
下载链接:
https://huggingface.co/datasets/DarshanScripts/stratego
下载链接
链接失效反馈官方服务:
资源简介:
这个数据集包含了大语言模型之间进行的Stratego比赛的日志。数据集分为移动和游戏两部分,每个部分都有详细的字段信息。数据集使用MIT许可证授权,记录了使用mistral:7b模型的一场比赛。
创建时间:
2025-11-28
原始信息汇总
Stratego LLM Game Logs 数据集概述
数据集基本信息
- 数据集名称: Stratego LLM Game Logs
- 发布者: davszi
- 发布日期: 2025年
- 托管地址: https://huggingface.co/datasets/DarshanScripts/stratego
- 许可证: MIT License
- 语言: 英语 (en)
数据集内容与用途
- 核心内容: 包含由大型语言模型(LLM)进行的 Stratego(军棋)对局的游戏日志。
- 主要用途: 适用于强化学习和文本生成任务。
- 相关标签: stratego, board-game, llm-gameplay, game-logs
数据集规模与结构
- 数据量级: 1K<n<10K
- 训练集大小: 1,389,038 字节
- 训练集样本数: 6,782 条
- 下载大小: 102,034 字节
- 数据集总大小: 1,389,038 字节
- 配置: 默认配置 (
default),数据文件路径为data/train-* - 数据分割: 仅包含训练集 (
train)
数据字段详情
数据集中包含以下字段:
game_id: 唯一游戏标识符 (string)turn: 回合数 (int64)player: 玩家ID (0 或 1) (int64)model_name: 执行此步操作的大型语言模型名称 (string)move: 移动步骤,格式为[A4 B4](string)from_pos: 移动起始位置 (string)to_pos: 移动目标位置 (string)piece_type: 被移动棋子的类型 (string)board_state: 棋盘状态 (string)available_moves: 可用移动步骤 (string)move_direction: 移动方向 (string)target_piece: 目标棋子 (string)battle_outcome: 战斗结果 (string)prompt_name: 提示词名称 (string)game_winner: 游戏获胜者 (string)game_result: 游戏结果 (string)
数据集结构与统计
- 使用的模型: mistral:7b
- 总游戏局数: 1
- 数据结构划分:
moves: 包含单步移动记录(回合、玩家、移动、棋子类型等)。games: 包含游戏级别的摘要(总回合数、模型、结果)。
使用方式
可通过 datasets 库加载数据集:
python
from datasets import load_dataset
dataset = load_dataset("DarshanScripts/stratego")
引用格式
如需引用本数据集,请使用以下BibTeX格式: bibtex @misc{stratego-llm-games, title={Stratego LLM Game Logs}, author={davszi}, year={2025}, publisher={Hugging Face}, url={https://huggingface.co/datasets/DarshanScripts/stratego} }
搜集汇总
数据集介绍

构建方式
在强化学习与文本生成交叉领域,Stratego数据集通过大型语言模型自主对弈的方式构建而成。该数据集记录了基于mistral:7b模型进行的Stratego棋盘游戏完整对局日志,涵盖从初始布局到终局的全过程。数据采集过程模拟真实游戏环境,模型依据预设规则与策略生成每一步移动决策,系统自动捕获并结构化存储对局中的动作序列、棋盘状态及战斗结果等多维度信息,形成包含六千余条移动记录的详实轨迹。
使用方法
该数据集适用于研究大型语言模型在不完全信息博弈中的推理能力与策略生成机制。使用者可通过Hugging Face数据集库直接加载,利用过滤功能按模型或游戏阶段提取特定子集进行分析。典型应用场景包括构建强化学习训练环境、评估模型决策一致性、挖掘游戏战术模式,或作为基准测试数据用于比较不同模型在复杂策略游戏中的表现。数据集的标准化字段设计便于直接整合至机器学习流水线,支持从行为分析到策略优化的系列研究任务。
背景与挑战
背景概述
在人工智能与博弈论交叉领域,战略棋盘游戏长期被视为评估智能体决策能力的重要测试平台。Stratego数据集由研究人员davszi于2025年创建并发布,专注于记录大型语言模型在经典战略游戏Stratego中的对弈日志。该数据集旨在探究语言模型在非完全信息、长时程规划及动态对抗环境下的推理能力,为理解模型在复杂决策任务中的行为模式提供了实证基础,对强化学习与生成式人工智能的融合研究具有推动作用。
当前挑战
Stratego数据集所针对的核心领域问题在于非完全信息博弈中的序列决策优化,其挑战体现在模型需在隐藏棋子类型、有限观测及长期战略交互的约束下进行有效规划。数据构建过程中的挑战则源于生成高质量对弈日志的复杂性,包括确保不同语言模型在统一规则下的交互一致性、准确记录棋盘状态转换与战斗结果,以及处理大规模动作空间带来的标注与验证负担。
常用场景
经典使用场景
在强化学习与博弈论领域,Stratego数据集通过记录大型语言模型在经典棋盘游戏Stratego中的对弈日志,为研究者提供了分析智能体决策过程的宝贵资源。该数据集常用于评估语言模型在复杂不完全信息环境下的策略生成能力,支持对模型在动态对抗场景中的行为模式进行系统性研究,从而深化对多步规划与推理机制的理解。
解决学术问题
该数据集有效解决了人工智能在不完全信息博弈中策略学习与评估的学术挑战。通过提供详细的回合制移动记录与棋盘状态,它使研究者能够定量分析语言模型在隐藏信息条件下的决策质量,探索其长期规划与适应性策略的局限性,为开发更鲁棒的博弈智能体奠定了实证基础,推动了不完全信息博弈理论的发展。
实际应用
在实际应用中,Stratego数据集可用于训练和优化基于语言模型的游戏智能体,提升其在策略性游戏中的表现。这些技术可延伸至商业谈判、军事模拟或自动化决策系统等需要复杂策略制定的场景,通过模拟人类般的推理过程,增强智能系统在不确定环境中的应对能力,为现实世界的策略优化提供参考框架。
数据集最近研究
最新研究方向
在强化学习与大型语言模型交叉领域,Stratego数据集正成为探索不完全信息博弈智能体的关键资源。该数据集记录了语言模型在Stratego棋盘游戏中的对弈日志,为研究模型在复杂策略环境下的决策过程提供了实证基础。前沿研究聚焦于利用此类数据训练模型掌握长期规划与隐式推理能力,以应对游戏中的不确定性和欺骗策略。随着多智能体协作与对抗系统的兴起,该数据集助力于评估语言模型在动态交互中的适应性,推动通用人工智能在策略性任务上的进展。
以上内容由遇见数据集搜集并总结生成



