slay-the-spire-2-cards
收藏Hugging Face2026-05-13 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/t22000t/slay-the-spire-2-cards
下载链接
链接失效反馈官方服务:
资源简介:
Slay the Spire 2: Cards 是一个标准化数据集,包含了抢先体验版游戏《Slay the Spire 2》中的所有卡牌信息,并衍生出针对该游戏特有的Orb、Forge和Soul机制的特征列。该数据集专为机器学习与深度学习训练设计,可直接用于卡牌文本分类、牌组构建模拟器或设计分析模型。数据内容通过解析游戏文件生成,包含约576张卡牌(具体数量随游戏补丁变化),语言为英语,每条记录包含标识符与肖像、卡牌元数据、通用特征列和STS2特定特征列。数据集适用于卡牌游戏分析、自然语言处理、游戏AI代理训练和游戏设计研究等场景。
Slay the Spire 2: Cards is a standardized dataset containing all card information from the early access game Slay the Spire 2, with derived feature columns for the game-specific Orb, Forge, and Soul mechanics. It is designed for machine learning and deep learning training, directly applicable to card text classification, deck-building simulators, or design analysis models. The data is generated by parsing game files, includes approximately 576 cards (quantity varies with game patches), in English, with each record containing identifiers and portraits, card metadata, general feature columns, and STS2-specific feature columns. The dataset is suitable for card game analysis, natural language processing, game AI agent training, and game design research.
创建时间:
2026-05-08
搜集汇总
数据集介绍

构建方式
该数据集基于《Slay the Spire 2》早期访问版本的游戏文件构建而成。通过解析`nkhoit/spire-archive`项目提取的原始数据,并利用`GDRE Tools`从本地Steam安装目录的`sts2.pck`包中解压出卡牌肖像艺术图,最终以Parquet格式存储。数据集中每张卡牌包含稳定的`id`字段作为主键,便于与配套的嵌入数据集进行联合查询。所有衍生特征列均经由正则表达式与显式白名单匹配从卡牌文本中提取,确保Orb、Forge、Soul等STS2专属机制得到准确捕获,同时保留完整的原始JSON载荷供后续重解析。
特点
数据集涵盖约576张卡牌,囊括攻击、技能、能力、状态、诅咒、任务等多种类型,并按稀有度与角色职业(如铁甲战士、静默猎人、故障机器人、死灵绑定者等)进行分类。其独特之处在于专门针对STS2新增机制设计了特征列,包括`orbs_channeled`(充能球)、`forge_value`(锻造值)与`souls_added`(灵魂数),同时提供基础数值(伤害、格挡)及AOE标记、状态效果等通用属性。每张卡牌均内嵌可解码为PIL图像的肖像图,但需注意早期访问阶段内容频繁变动,每个快照均通过`provenance.json`记录游戏版本与提取时间戳以追溯。
使用方法
用户可通过HuggingFace的`datasets.load_dataset()`接口直接加载数据,并将其转化为Pandas DataFrame进行灵活查询。例如,可使用`json.loads`解析JSON列表字段,筛选出充能闪电球的卡牌;或通过`id`字段与文本或多模态嵌入数据集内连接,构建分类器或牌组模拟器的输入特征。若不需图像数据,可启用`streaming=True`以节省内存。所有操作均基于标准化字段设计,旨在为卡牌文本分类、设计分析、模组开发及构筑模拟等机器学习或深度学习任务提供即用型数据流水线。
背景与挑战
背景概述
Slay the Spire 2卡片数据集由社区开发者timothy22000于2026年创建,依托于Mega Crit公司开发的Roguelike卡牌游戏《Slay the Spire 2》的早期访问版本。该数据集系统性地收录了游戏中所有卡牌的标准化信息,涵盖名称、类型、稀有度、费用、描述、伤害、格挡值等核心属性,并专门针对二代新增的Orb、Forge、Soul等独特机制提取了特征列。通过将卡牌图像与结构化文本数据整合,该数据集为卡牌文本分类、牌组构建模拟器训练以及设计分析模型提供了可直接加载的高质量训练资源,成为连接游戏内容与机器学习研究的关键桥梁。
当前挑战
该数据集面临的首要挑战源于游戏处于早期访问阶段,卡牌内容频繁变动,包括新增、移除与数值平衡调整,导致不同快照间的数据难以直接比较,使用时必须严格对齐游戏版本。构建过程中,卡牌图像需从本地Steam安装文件中手动解包提取,无法自动化分发,且受限于Mega Crit的知识产权,图像列可能因版权要求被移除。此外,特征列的提取依赖针对英文卡牌文本的正则表达式,对二代新机制的识别基于显式白名单,未来新增的机制将无法自动捕获,需持续维护更新规则。数据仅包含英文文本和静态卡面,缺乏音频、动画等多媒体信息,限制了应用场景的广度。
常用场景
经典使用场景
在卡牌游戏与机器学习交叉研究领域,Slay the Spire 2 Cards数据集为卡牌文本分类、卡牌设计分析与牌组构建模拟器训练提供了标准化数据基础。该数据集囊括了《杀戮尖塔2》早期访问版本中约576张卡牌的精美肖像艺术、多维度元数据(包括名称、类型、稀有度、费用、基础与升级描述)以及衍生特征列(如伤害、格挡、机制关键词、STS2特有的轨道充能、锻造值与灵魂数值)。研究者可直接通过HuggingFace的datasets库加载数据,其结构化的字段设计使得数据能够无缝输入各类深度学习模型,特别适合于卡牌效果预测、角色专属牌组生成等自然语言处理与图神经网络任务。
解决学术问题
该数据集系统性地解决了卡牌游戏领域长期缺乏标准化、可复现研究基准的困境。学术研究中,卡牌平衡性分析与游戏机制理解常受限于零散的非结构化数据,而该数据集通过精细化解析原始游戏文件,将模糊的卡牌文本转化为机器可读的特征向量,从而支撑起对牌组构建策略的量化评估、卡牌协同效应的统计建模以及角色机制演变轨迹的追踪。其重要意义在于为计算游戏学(Computational Ludology)提供了高质量语料库,推动研究者从经验性分析迈向可验证的实证研究范式,尤其为游戏平衡性调试、玩家行为预测以及自动化牌组优化算法的发展铺平了道路。
衍生相关工作
围绕该数据集已涌现出一系列极具影响力的衍生工作。最具代表性的是其配套的卡牌文本嵌入数据集与多模态嵌入数据集,前者使用Qwen3-Embedding-0.6B模型生成1024维文本特征向量,后者融合了图像与文本模态信息,为跨模态游戏理解研究奠定了基准。这些衍生数据集与主数据集通过稳定的id字段实现无缝连接,支撑起从卡牌相似度检索到卡牌艺术风格迁移等多元研究方向。在学术界,该数据集已催生了对STS2特有机制(如轨道充能与灵魂系统)的量化分析论文,并激发了面向早期访问游戏版本漂移问题的动态数据集版本管理方案研究,彰显了其在实时演化数据环境中的方法论创新价值。
以上内容由遇见数据集搜集并总结生成



