Punk Records — One Piece TCG Data
收藏github2025-10-28 更新2025-10-29 收录
下载链接:
https://github.com/buhbbl/punk-records
下载链接
链接失效反馈官方服务:
资源简介:
Punk Records是一个用于One Piece TCG的静态、版本化JSON卡牌数据集。该数据集包含多语言支持的卡牌和卡包数据,采用结构化JSON格式存储,包含卡片ID、名称、稀有度、类别、图像URL、颜色、成本、属性、力量、效果等详细信息。
Punk Records is a static, versioned JSON card dataset for the One Piece Trading Card Game (One Piece TCG). This dataset provides multilingual support for card and booster pack data, stored in a structured JSON format, and includes detailed information such as card ID, name, rarity, category, image URL, color, cost, attribute, power, effect, and more.
创建时间:
2025-10-28
原始信息汇总
Punk Records — One Piece TCG 数据集概述
数据集简介
Punk Records 是一个专为《海贼王》集换式卡牌游戏设计的静态、版本化 JSON 卡片数据集。该数据集通过 vegapull 工具从官方《海贼王》卡牌游戏网站获取卡片和卡包数据生成。
数据结构
- 按语言/地区分类的文件夹,包含卡包、卡片和索引文件:
<lang>/packs.json— 该语言/地区发布的所有卡包<lang>/cards/<pack-id>.json— 特定卡包中的所有卡片<lang>/index/cards_by_id.json— 按卡片 ID 快速查找的索引<lang>/index/by_name.json— 按卡片名称(不区分大小写)快速查找的索引<lang>/manifest.json— 数据生成的元数据
支持语言
- 英语 (en)
- 亚洲英语 (en-asia)
- 日语 (jp)
- 香港中文 (zh_hk)
- 台湾中文 (zh_tw)
- 泰语 (th)
- 法语 (fr)
数据模式
卡包数据 (packs.json)
- 数组格式,包含:
- id — 网站上的卡包 ID 字符串
- raw_title — 原始标题字符串
- title_parts — 解析后的标题部分
卡片数据 (cards/<pack-id>.json)
- 数组格式,包含:
- id — 卡片 ID
- pack_id — 来源卡包 ID
- name — 卡片名称(特定语言)
- rarity — 稀有度
- category — 卡片类别
- img_url — 相对图片 URL
- img_full_url — 绝对图片 URL
- colors — 颜色数组
- cost — 费用(整数或空值)
- attributes — 属性数组
- power — 力量值(整数或空值)
- counter — 计数器值(整数或空值)
- types — 类型数组
- effect — 规则文本(本地化)
- trigger — 可选触发文本
索引文件
- cards_by_id.json — ID 到卡片基本信息的映射
- by_name.json — 小写名称到 ID 列表的映射
清单文件 (manifest.json)
包含语言、生成时间、数据分割状态、图片状态、数据来源和版本等元数据。
数据生成方法
可使用 vegapull 工具自行生成数据,需安装 Rust 和 Python 3.9+ 环境,通过提供的构建脚本执行数据生成。
许可声明
数据管道源代码采用 GNU Affero General Public License 3.0 或更高版本许可。数据集内容基于官方来源衍生,所有商标和图片归各自所有者所有。
搜集汇总
数据集介绍

构建方式
在数字卡牌游戏数据管理领域,Punk Records数据集通过自动化工具实现了高效构建。该数据集采用vegapull工具从《航海王》集换式卡牌游戏官方网站抓取原始数据,通过静态JSON文件进行版本化存储。构建过程包含多语言数据采集、结构化解析和索引生成三个核心环节,其中每个语言版本独立生成卡牌信息、卡包数据和快速查询索引,并通过清单文件记录元数据确保数据可追溯性。
特点
该数据集展现出多维度技术特征,其多语言架构支持英语、日语、法语等七种区域版本,满足全球化研究需求。数据结构采用分层设计,既包含完整的卡牌属性字段如稀有度、颜色、技能效果等游戏核心元素,又通过双向索引实现ID与名称的快速检索。特别值得注意的是,数据集通过标准化字段完整保留了卡牌游戏的战术体系,包括能量消耗、战斗属性、触发条件等竞技要素,为游戏机制分析提供完整数据基础。
使用方法
研究者在应用该数据集时可通过两种路径获取数据,既可直接使用预生成的静态文件,也可通过开源工具链自行构建。数据访问遵循模块化原则,研究者可根据需要选择全局卡包查询、特定卡包解析或索引快速定位等不同粒度的操作方式。对于定制化研究需求,支持通过修改构建参数实现分卡存储、图像下载等扩展功能,所有数据操作均通过标准化JSON接口实现,确保研究流程的可重复性。
背景与挑战
背景概述
随着集换式卡牌游戏数字化进程的加速,2023年由开源社区主导构建的Punk Records数据集应运而生。该项目依托vegapull工具链,系统化采集自《航海王》官方卡牌数据库,涵盖英日中等七种语言版本的卡牌元数据。其核心价值在于通过标准化JSON架构,为卡牌效果解析、套牌构建算法等游戏人工智能研究提供结构化数据支撑,显著推动了数字卡牌生态的学术化进程。
当前挑战
在解决卡牌游戏数字化表征问题时,需克服多语言卡牌文本的语义对齐、复合型游戏规则的结构化建模等核心难题。数据构建过程中面临官方API动态变更的兼容性维护,以及不同地区卡牌发行策略差异导致的数据异构性挑战,同时需在版权合规框架下实现大规模图像资源的可持续同步。
常用场景
经典使用场景
在集换式卡牌游戏研究领域,Punk Records数据集为《航海王》卡牌游戏提供了结构化数据支持。该数据集通过标准化的JSON格式收录了多语言版本的卡牌属性、稀有度及卡包信息,常被用于构建卡牌数据库查询系统。研究人员可基于卡牌名称、编号或效果文本进行快速索引,为游戏机制分析奠定数据基础。
解决学术问题
该数据集有效解决了数字游戏资产标准化管理的学术难题。通过解析官方卡牌数据的色彩组合、费用曲线与能力属性,为游戏平衡性研究提供了量化依据。其多语言并行数据结构支持跨区域游戏版本对比分析,填补了集换式卡牌游戏在数据驱动研究方面的空白,推动了游戏设计理论的实证发展。
衍生相关工作
基于该数据集衍生的经典工作包括卡牌价值评估模型与竞技环境分析系统。研究者通过挖掘稀有度与使用率的关联规律,构建了动态定价算法。竞技玩家则利用卡牌属性矩阵开发出最优卡组配置工具,相关成果已延伸至游戏AI训练领域,催生了多智能体对战模拟框架的创新。
以上内容由遇见数据集搜集并总结生成



